WhisperDirect Logo

WhisperDirect

Download

高精度の音声文字起こし

WhisperDirect は、ご自身の API キーで動作する高精度の音声文字起こしアプリです。使った分だけ支払う、低コストで柔軟な従量課金に対応しています。

Slack 連携に対応:選択したチャンネルへ、文字起こし・要約・議事録を自動投稿できます。

🚀 App Store で入手

サブスクなし — OpenAI キーによる従量課金で低コスト。高速・高精度の文字起こし。要約/議事録、Slack 投稿、字幕(VTT/SRT)エクスポート対応。

💸 参考料金

Whisper API

1分あたり約 $0.006(≒ 1時間 $0.36)。OpenAI 公式レート(2025年7月時点)に基づく目安です。

要約・議事録

GPT-4.1 GPT-5 (nano, mini) models. を使用。英語テキスト数千語の要約でも通常は数セント程度(入力長により変動)。

課金について

料金は OpenAI の価格に従い、変更される場合があります。詳しく見る

✨ WhisperDirect でできること

録音

マイクボタンで録音し、その場で文字起こし。

音声ファイルの取込み

音声ファイルをインポートしてテキスト化。

共有拡張

iOS の共有シートから直接インポート。

動画の取込み

動画ファイルを取り込むと、音声を自動抽出&圧縮。

自動ログ

取込み/変換後に各ファイルの長さとサイズを自動記録。

再生同期ハイライト

再生位置に合わせて、現在のセグメントを自動ハイライト

タイムライン・マーカー

カスタム間隔でマーカーを挿入(5秒刻みで設定可能)。

要約&議事録

要約と議事録を生成(プロンプトは設定で編集可能)。

エクスポート

音声/テキスト/要約/議事録をエクスポート。

Slack 自動投稿

文字起こし・要約・議事録をSlack に自動投稿

字幕出力

字幕(VTT/SRT)をエクスポート。

推定コストの確認

設定から推定コストを確認(音声長・文字数ベース)。

Google Drive 連携

音声や文字起こしを Google Drive に自動バックアップ。PC や他の端末とスムーズに同期。

画像からのOCR文字起こし

画像からのOCR文字起こしに対応(複数画像一括処理可) 端末内で処理しているためAPI利用料は発生しません。

🎧 対応フォーマット

音声: mp3, m4a, aac, wav, flac, ogg, opus, wma, amr, mpga, webm, aiff, caf

動画: mp4, mov, m4v, webm, mkv, avi, mpeg, mpg

🔑 注意事項

本アプリの利用には API キー(例: OpenAI)が必要です。料金は各サービスの料金ポリシーに基づき課金されます。