使い方とセットアップ
初回ウィザードに沿って進むだけ。難しい設定はありません。
01
ダウンロードして起動
配布サイトから .dmg をダウンロードし、アプリケーションへ。初回はウィザードが開きます。
02
権限を許可
マイクとカレンダーを許可。画面収録の権限は不要です。
03
文字起こしの準備(自動)
Python と ffmpeg はアプリに同梱。初回だけ文字起こし用ライブラリを自動で準備します(ネット接続が必要)。
04
推奨モデルを自動ダウンロード
言語に合った推奨モデルを自動でダウンロード(進捗バー付き)。完了後すぐに使えます。
05
話者分離(任意)
「誰が話したか」も出したい場合は、無料の HuggingFace トークンを設定します(任意)。
初回ウィザードの実UI
モデルの選び方
文字起こしの精度と速度は「モデル」で決まります。あなたのMacで動かせる中で一番いいものを選べば大丈夫。モデルは初回に自動ダウンロードされ、設定 →「文字起こし」でいつでも変更できます。
まず結論
日本語の会議
Kotoba Whisper v2.0
日本語特化。large-v3 より高精度で軽く、ほぼすべてのMacで動きます。
日本語+英語が混ざる
Kotoba Whisper Bilingual v1.0
日英どちらも高精度。
その他の言語・多言語
Whisper large-v3
多言語で最高精度。下の表でMacに合わせて選びます。
あなたのMacで動かせる、一番いいモデル
Apple Silicon は GPU(mlx)、Intel は CPU(faster)で動きます。日本語特化の Kotoba は CPU 動作・軽量なので、ほぼどのMacでも使えます。
| あなたのMac | 日本語 | 多言語 |
|---|---|---|
| Apple Silicon・16GB 以上(M1 Pro/Max・M2/M3/M4 など) | Kotoba Whisper v2.0 | large-v3(mlx / GPU) |
| Apple Silicon・8GB(M1/M2/M3 無印) | Kotoba Whisper v2.0 | medium(mlx / GPU) |
| Intel・16GB 以上 | Kotoba Whisper v2.0 | large-v3(faster / CPU・低速) |
| Intel・8GB | Kotoba Whisper v2.0 | medium(faster / CPU) |
| とにかく軽く・下書き用途 | small | small |
モデル一覧
| モデル | 対応言語 | サイズ | 必要メモリ | 特徴 |
|---|---|---|---|---|
| Kotoba Whisper v2.0 | 日本語 | 約1.5GB | 4GB 以上 | 日本語特化。large-v3 より高精度/高速。日本語ならこれがおすすめ。 |
| Kotoba Whisper Bilingual v1.0 | 日本語・英語 | 約1.5GB | 4GB 以上 | 日本語と英語の両対応。 |
| Whisper large-v3 | 多言語 | 約3GB | 8GB 以上(16GB+推奨) | 多言語で最高精度。Apple Silicon は mlx、Intel は faster。 |
| Whisper medium | 多言語 | 約1.5GB | 4GB 以上 | 多言語・バランス型(初期設定)。 |
| Whisper small | 多言語 | 約0.5GB | 2GB 以上 | 軽量・高速。低スペックや下書き向け。 |
| Distil-Whisper large-v3 | 英語 | 約1.5GB | 4GB 以上 | 英語特化。large-v3 級の精度で高速・軽量。 |
お使いのMacで動かないモデル(メモリ・ディスク不足、Apple Silicon 専用 など)は、アプリが自動で警告します。迷ったら、日本語は Kotoba Whisper v2.0、それ以外は large-v3 を選べば失敗しません。