使い方とセットアップ

初回ウィザードに沿って進むだけ。難しい設定はありません。

ダウンロードして起動

配布サイトから .dmg をダウンロードし、アプリケーションへ。初回はウィザードが開きます。

マイクとカレンダーを許可。画面収録の権限は不要です。

Python と ffmpeg はアプリに同梱。初回だけ文字起こし用ライブラリを自動で準備します（ネット接続が必要）。

言語に合った推奨モデルを自動でダウンロード（進捗バー付き）。完了後すぐに使えます。

「誰が話したか」も出したい場合は、無料の HuggingFace トークンを設定します（任意）。

初回セットアップ

初回ウィザードの実UI

文字起こしの精度と速度は「モデル」で決まります。あなたのMacで動かせる中で一番いいものを選べば大丈夫。モデルは初回に自動ダウンロードされ、設定 →「文字起こし」でいつでも変更できます。

日本語の会議

Kotoba Whisper v2.0

日本語特化。large-v3 より高精度で軽く、ほぼすべてのMacで動きます。

日本語＋英語が混ざる

Kotoba Whisper Bilingual v1.0

日英どちらも高精度。

その他の言語・多言語

Whisper large-v3

多言語で最高精度。下の表でMacに合わせて選びます。

Apple Silicon は GPU（mlx）、Intel は CPU（faster）で動きます。日本語特化の Kotoba は CPU 動作・軽量なので、ほぼどのMacでも使えます。

あなたのMac	日本語	多言語
Apple Silicon・16GB 以上（M1 Pro/Max・M2/M3/M4 など）	Kotoba Whisper v2.0	large-v3（mlx / GPU）
Apple Silicon・8GB（M1/M2/M3 無印）	Kotoba Whisper v2.0	medium（mlx / GPU）
Intel・16GB 以上	Kotoba Whisper v2.0	large-v3（faster / CPU・低速）
Intel・8GB	Kotoba Whisper v2.0	medium（faster / CPU）
とにかく軽く・下書き用途	small	small

モデル	対応言語	サイズ	必要メモリ	特徴
Kotoba Whisper v2.0	日本語	約1.5GB	4GB 以上	日本語特化。large-v3 より高精度/高速。日本語ならこれがおすすめ。
Kotoba Whisper Bilingual v1.0	日本語・英語	約1.5GB	4GB 以上	日本語と英語の両対応。
Whisper large-v3	多言語	約3GB	8GB 以上（16GB＋推奨）	多言語で最高精度。Apple Silicon は mlx、Intel は faster。
Whisper medium	多言語	約1.5GB	4GB 以上	多言語・バランス型（初期設定）。
Whisper small	多言語	約0.5GB	2GB 以上	軽量・高速。低スペックや下書き向け。
Distil-Whisper large-v3	英語	約1.5GB	4GB 以上	英語特化。large-v3 級の精度で高速・軽量。

お使いのMacで動かないモデル（メモリ・ディスク不足、Apple Silicon 専用など）は、アプリが自動で警告します。迷ったら、日本語は Kotoba Whisper v2.0、それ以外は large-v3 を選べば失敗しません。