WhisperDirect は、ご自身の API キーで動作する高精度の音声文字起こしアプリです。使った分だけ支払う、低コストで柔軟な従量課金に対応しています。
Slack 連携に対応:選択したチャンネルへ、文字起こし・要約・議事録を自動投稿できます。
🚀 App Store で入手サブスクなし — OpenAI キーによる従量課金で低コスト。高速・高精度の文字起こし。要約/議事録、Slack 投稿、字幕(VTT/SRT)エクスポート対応。
1分あたり約 $0.006(≒ 1時間 $0.36)。OpenAI 公式レート(2025年7月時点)に基づく目安です。
GPT-4.1 GPT-5 (nano, mini) models. を使用。英語テキスト数千語の要約でも通常は数セント程度(入力長により変動)。
料金は OpenAI の価格に従い、変更される場合があります。詳しく見る
マイクボタンで録音し、その場で文字起こし。
音声ファイルをインポートしてテキスト化。
iOS の共有シートから直接インポート。
動画ファイルを取り込むと、音声を自動抽出&圧縮。
取込み/変換後に各ファイルの長さとサイズを自動記録。
再生位置に合わせて、現在のセグメントを自動ハイライト。
カスタム間隔でマーカーを挿入(5秒刻みで設定可能)。
要約と議事録を生成(プロンプトは設定で編集可能)。
音声/テキスト/要約/議事録をエクスポート。
文字起こし・要約・議事録をSlack に自動投稿。
字幕(VTT/SRT)をエクスポート。
設定から推定コストを確認(音声長・文字数ベース)。
音声や文字起こしを Google Drive に自動バックアップ。PC や他の端末とスムーズに同期。
画像からのOCR文字起こしに対応(複数画像一括処理可) 端末内で処理しているためAPI利用料は発生しません。
音声: mp3, m4a, aac, wav, flac, ogg, opus, wma, amr, mpga, webm, aiff, caf
動画: mp4, mov, m4v, webm, mkv, avi, mpeg, mpg
本アプリの利用には API キー(例: OpenAI)が必要です。料金は各サービスの料金ポリシーに基づき課金されます。