Superwhisperとは?使い方と料金!Windowsでも使えるAI音声入力アプリ

Superwhisperとは、OpenAIの高性能音声認識モデル「Whisper」を搭載したAI音声入力・テキスト変換アプリです。

Superwhisperを使えば、話すだけで音声を言語化して文章作成し、用途に応じて形式も整えられます。

この記事では、Superwhisperの概要や、Mac・WindowsなどのOS別の使い方と料金もわかりやすく解説していきます。

目次

Superwhisperとは

Superwhisperは、高精度な音声認識技術とLLM(大規模言語モデル)を融合させた、次世代のAIライティングツールです。高機能な音声モデルに対応しており、さまざまな言語をスピーディーに理解し、用途に合わせて文章も整えてくれます。

WindowsやiPhoneでの利用も可能になり、現在も進化し続けています。

Superwhisperの概要

単に声を文字にするだけでなく、文脈を理解して「えー」などの不要語(フィラーワード)を削除し、メールやチャット、議事録に最適な「整った文章」へ瞬時に変換・要約します。また、認識したテキストは、今開いているアプリ(Slack、メール、Word等)のカーソル位置に直接流し込まれます。

Macを中心に、現在はWindowsやiPhone/iPadにも対応しています。用途に応じて軽量モデルと高精度モデルを切り替えられるほか、特定の指示(コンテキスト)を与えて出力を調整できます。最大の特徴はプライバシーへの配慮で、音声データをデバイス内で処理するオフライン運用も選択できるため、機密情報を扱うビジネスパーソンでも安心して導入できます。

他の音声ツールとの違い

音声入力ツールは「テキスト変換のみ」と「AI整形まで対応」の2タイプに大別されます。macOS・Windowsの標準音声入力は前者の代表例で、話した言葉をそのまま文字化するため、「えー」「あー」といった口癖(フィラーワード)の削除や句読点補完は手動作業が発生します。

Superwhisperは後者に分類され、フィラーワードの自動除去・句読点補完に加え、「要約」「翻訳」「ビジネスメール調への書き換え」まで一括出力できます。さらに、カーソルを置いたアプリに直接テキストを貼り付ける機能や、画面のコンテキスト(文脈)を読んで出力を調整する機能は、競合サービスと比較しても際立つ特徴です。

Superwhisperによってできること

Superwhisperは、音声入力を単なる文字起こしにとどまらず、用途に合わせた「使える文章」へ変換できる点が大きな魅力です。

以下に、代表的な活用シーンとその具体的な使い方をまとめました。

用途活用内容
メモ・日記考えていることをそのまま話して記録
AIが読みやすい段落構成に整理
Notionなどへ残しやすい形に整形
メール・返信用件を箇条書きで話して下書き化
「丁寧なビジネスメールに変換」といった指示に対応
そのまま送れる文面に整えやすい
チャット短い指示を話して返信文を作成
SlackやDiscord向けの自然な口語体に調整
文脈に合った言い回しで即レスしやすい
プログラミングコードの意図や処理内容を話して説明を生成
Docstringやコメント文の作成に活用可能
実装内容の補足を素早く残せる
会議AIが話者を分離して書き起こし
参加者ごとの発言内容を整理して記録
議事メモや会話ログの作成に使いやすい

Superwhisperの基本機能と仕組み

Superwhisperでは、「録音 → 解析 → 編集 → 出力」がひとつのアプリで完結できます。その機能の中心となる「モード」「モデル」「コンテキスト」の3つの概念を理解すると、このアプリの真価が見えてきます。

ここでは、この3つの機能と対応環境について、詳しく解説していきます。

モード (Modes)

アウトプットの「性格」を決める「モード」とは、話し言葉をどんな形式に変換するかという「プリセット(指示書)」のことです。

どう機能するか

Voice to Text・メッセージ・メール・メモ・スーパー・会議の6つの標準モードとカスタムモードがあり、各標準モードは用途別に最適化された変換処理を行い、目的に合った言い回しに整えます。

カスタマイズ性

カスタムモードでは、プロンプト(AIへの命令文)を自分で書けるため、「語尾をです・ます調にする」「特定のキーワードを自動でタグ付けする」といった独自のルールを適用できます。

モデル (Models)

認識の「知能」を選ぶ「モデル」とは、音声を文字に変換するAI(エンジン)の性能レベルのことです。

デバイス性能との兼ね合い

PCやデバイスのスペックに合わせて、「高速だが精度がそこそこの軽量音声モデル(Pro/Standard)」から、「少し時間はかかるがボソボソ声も高精度に認識しやすい音声モデル(Ultra/S1-Voice)」まで選択できます。

ローカルかクラウドか

他のAI音声アプリと異なり、「ローカルモデル」も利用できます。オフラインでも高速な音声変換が可能です。Pro版ではさらに高度な外部のLLM(GPT-5等)と連携させる構成も選べます。「クラウドモデル」では、100以上の言語に対応しており、翻訳も可能です。

コンテキスト (Context)

現在の「状況」を読み取る「コンテキスト」とは、AIが「今、ユーザーが何をしているか」を理解するための周辺情報のことです。

Super Modeの真骨頂

この機能を有効にすると、AIは「選択テキスト」「アプリの入力欄やウィンドウ情報」「クリップボード」の3種類の情報を参照します。なお、全種が標準で有効になるのはSuper Modeのみで、カスタムモードでは個別に有効化の設定が必要です。

具体例

相手からのメールを画面に開いた状態で「承知したと伝えて」とだけ話せば、コンテキスト(文脈)機能によってAIが「相手の名前」や「件名」を自動で補完し、整った返信文を作りやすくなります。

Superwhisperを使えるプラットフォーム

Superwhisperはさまざまな環境で利用できます。対応しているプラットフォームと、利用可能な機能について見ていきましょう。

プラットフォーム対応状況主な機能・特徴主な制限
macOS推奨環境Appleシリコン対応
M1 / M2 / M3 / M4で高性能
macOS 13.3以降で動作
グローバル入力対応
ショートカット対応
特になし
Windows対応Windows 10以降で動作
x64 / arm64対応
ショートカット対応
各アプリへ直接音声入力可能
一部機能は未実装
FileSync
話者分離
Models Library / Favorites
ローカル言語モデル
iOS対応App Storeで配信
iOS 18以降推奨
キーボード拡張として動作
LINE / Slack / メモ帳などで利用可能
音声入力・要約・文章整形
専用キーボードへの切替が必要
Android公式情報なし現時点で公式対応は確認できずiOS版が先行

プライバシー対応について

Superwhisperは音声データを基本的にローカルで処理します。他のAI音声アプリとは異なり、デフォルト設定では、データはSuperwhisperのサーバー上に保存されません。

ローカルモデル利用時は端末内処理が完結します。なお、クラウドモデルや外部AI(GPT-5等)を使う場合は、テキストデータが各サービスに送信されます。

Usage Data

We do not collect any usage data when you use Superwhisper. We respect your right to privacy and do not track or log your usage of Superwhisper in any way.

訳:Superwhisperのご利用時に、使用状況データは一切収集されません。お客様のプライバシー権を尊重し、Superwhisperの使用状況を一切追跡または記録しません。

Data Security

We take the security of your personal information very seriously. Since Superwhisper processes all audio data locally, there is no need for data transmission. This significantly reduces the risk of unauthorized access or disclosure of your information. 

訳:当社は、お客様の個人情報のセキュリティを非常に重視しています。Superwhisperはすべての音声データをローカルで処理するため、データ転送の必要がありません。これにより、不正アクセスや情報漏洩のリスクが大幅に軽減されます

出典:https://superwhisper.com/privacy

Superwhisperの料金とおすすめプラン

Superwhisperの料金プランは無料版、サブスクリプション版、買い切り版の3つのタイプがあります。無料版と有料版では使える機能に差があります。

料金プランと、各プランで使える機能の違い、さらにおすすめプランについて見ていきましょう。

各プランの比較表

Superwhisperには無料版・Pro(サブスクリプション)・Lifetime(買い切り)の3つのプランがあります。

利用シーンや予算に合わせて選べるよう、各プランの機能と価格の違いを以下の表にまとめました。

項目FreeProLifetime
料金0円月額:約1,300円〜
年額:約13,000円〜
学生40%オフ
$249.99
約38,000円〜
音声認識モデル基本モデルのみ
Standard / Nano / Fast
高精度モデル対応
Ultra / S1-Voiceなど
高精度モデル対応
Ultra / S1-Voiceなど
カスタムモード使用不可
15分無料体験あり
3モード作成可
無制限無制限
AI整形モデルローカルのみクラウド / ローカル
無制限
クラウド / ローカル
無制限
コンテキスト機能利用不可利用可
Super Mode など
利用可
Super Mode など
支払いなし1か月ごと
1年ごと
買い切り
一度のみ

Free(無料版)がおすすめな人

まずは自分のMacで正常に動作するか試したい場合や、たまに短いメモを音声で残す程度で、高い精度や高度な書き換えが不要な方に向いています。

無料版でもどのアプリに対しても音声でテキスト入力できます。会議の録音にも対応しており、100以上の言語を無料で利用できます。ただし、無料版だと音声モデルの選択肢が少なく、日本語への音声での書き起こし精度が低めです。

メールでのサポートサービスがあり、安心して利用できます。

Pro(サブスクリプション)がおすすめな人

最新のAIモデル(Ultraなど)を使って、プロレベルの精度を体感したい、特定のプロジェクト期間(数か月など)だけ集中して業務効率化したい方、または初期費用を抑えて常に最新のサービスを受けたい方におすすめです。年間購入にすると、2か月無料で使用できます。

Pro版をはじめとする有料プランでは、あらゆる言語から英語への変換ができ、優先的なサポートも受けられます。

Lifetime(買い切り)がおすすめな人

サブスクの月額費用を増やしたくない、「これから数年は毎日このアプリを使い続ける」と確信したパワーユーザーに向いています。3年以上使うのであれば、年額プランを更新し続けるより安上がりになります。

初回には、Pro版の録音機能を15分無料で試すこともできます。その後は無料版の機能が使用できます。まずは無料版で操作感を試し、次に1か月だけPro版(月額)を契約してみましょう。その上で「手放せない」と感じたら、買い切り版へ移行することをおすすめします。どのプランも、購入後30日以内であれば返金もできます。

購入経路と運用の注意点

購入経路は公式サイトApp Storeの2つの選択肢があります。

公式サイト購入

クーポン(初回割引など)が適用できる場合が多く、アップデートも最速です。基本的には公式サイト経由が推奨されます。

App Store経由

Apple IDで支払いを管理できるメリットがありますが、開発者への還元率や特定機能の反映がわずかに遅れる場合があります。

注意点として、1ライセンスで複数のMac(個人所有)にインストール可能ですが、同時利用には制限があるため、チームで使う場合は人数分のライセンスが必要です。

Superwhisperの使い方

Superwhisperの操作は意外と簡単で、シンプルな作りになっています。実際に試してみましょう。

Superwhisperの入手方法

STEP
アプリを入手する

まずは、公式サイト「https://superwhisper.com/」、またはApp Storeからアプリをダウンロードし、

Applicationsフォルダへ移動します。

STEP
setup.exeを起動

ダウンロードを押すと以下の画面になり、自動的にダウンロードが開始されます。

STEP
初期設定

初回起動時に「アクセシビリティ」と「マイク」の権限許可を求められるので、システム設定から必ず許可してください。これが未設定だと、他アプリへの自動入力が機能しません。

STEP
ダウンロード完了

ダウンロードができたら、画面上に黒い細長い表示が出てきます。ポインターを合わせると以下のような画面になります。

STEP
準備完了

ここまでできれば準備は完了です!実際に使用してみましょう。

Superwhisperの初期設定

STEP
言語とモデルの設定

ここからは設定変更の手順を解説します。

まず、Superwhisperのアイコンをクリックし、メニューからSettingsを開きます。

STEP
モード変更

メニューのModesから、使用したいモードを選びます。

設定の「Language」をJapaneseに固定すると、英語が混じるなどの誤認識を防げます。精度を上げたい場合は、設定からモード(Mode)を「Super」に変更(要Pro版)してください。

以上で初期設定は完了です。

基本操作

デフォルトでは「Shift + Control」で録音を開始し、再度押すと停止します(終了時はEsc)。

録音が終わると、AIが瞬時に整形を行い、今開いているアプリのカーソル位置にテキストを自動で貼り付けます。

トラブル時の切り分けについて

音声が入力されない・精度が出ない・ショートカットが反応しないなど、動作に違和感を感じたときは以下の項目を順番に確認してみましょう。

多くの場合、権限設定やモデル・ショートカットの見直しで解決します。

音声入力されない時

アクセシビリティ権限を一度オフ→オンにする。

精度が低い

周囲のノイズを減らすか、モデルを上位版へ変更する。

遅延がある時

Appleシリコン(M1以降)搭載機か確認。古い機体の場合は、軽量モデルを選択する。

ショートカットが反応しない

一度、全く別の組み合わせ(例:Option + Space など)に変更して、反応するかテストしてみる。

Superwhisperのよくある質問

Superwhisperについてのよくある質問を、実際の内容に沿って紹介します。

無料版でどの程度使えるのか?

無料版: 小規模なAIモデルのみ使用可能。精度はそこそこですが、専門用語やボソボソ声には弱いです。また、AIによる高度な書き換え(プロンプト機能)に回数制限があります。

Pro版: 「Ultra」や「S1-Voice」などのAIモデルが使用でき、認識精度が劇的に向上します。また、無限に「カスタムモード(メール用、要約用など)」を作れるため、タイピングを完全に代行させたいならProが必要です。

短文の単純な文字起こしなら無料版で十分ですが、仕事で使うなら、Pro版をおすすめします。

音声データや入力内容などのプライバシーは守られているか?

多くの音声入力アプリはクラウド(サーバー)で処理しますが、Superwhisperはローカルモデル利用時に端末内処理が完結します。

ローカルモデルを選んだ場合、録音された音声や整形済みテキストが開発元に送信されることはありません。「ローカル処理を選べる」点が、プライバシーを重視するユーザーに支持されている理由のひとつです。

日本語の精度が出ない時はどうしたらいいか?

日本語がうまく認識されないときは、「言語固定」と「モデルの選択」を見直しましょう。

Languageを固定: 設定で言語を「Automatic」から「Japanese」に固定してください。これにより、日本語を英語として誤認識するトラブルを回避できます。

語彙の追加(Vocabulary): 自分の名前や社名、業界用語をあらかじめ設定の「Vocabulary」に登録しておくと、AIがそれらを優先的に拾うようになります。

はっきり話す: 精度が低い時は、少しだけ滑舌を意識するか、Pro版で上位モデル(Ultra)に切り替えてください。

端末を変えた時のライセンスや同期はどうなるのか?

同一ユーザーなら複数台で利用可能ですが、同期は手動です。

公式サイト購入の場合、基本的には1ライセンスで自分所有の複数のPC・iPhone(例:自宅用と持ち運び用)にインストールできます。

設定の同期にはFileSync機能を利用できます。ただし、Windows版はFileSync未対応のため、現時点では手動での再設定が必要です。

仕事・機密情報で使う時の注意点はあるか?

ツール自体は安全ですが、「外部AI連携」の設定には注意してください。

ローカルモデル利用時: デバイスにのみデータが残るため、社外秘の会議内容でも安心して入力できます。

外部API連携時(注意): Pro版でOpenAIのGPT-5等を連携させて文章整形を行う設定にしている場合、テキストデータのみが各AIのサーバーへ送られます。超機密情報を扱う場合は、整形プロセスも「Local LLM」で行う設定になっているか確認しましょう。

企業で使用する場合Superwhisper Enterpriseを利用することを検討するのもよいでしょう。Enterprise 版では追加のデータ管理機能があります。

AIクラウドモデルを有効化し、自社のAPIキーでカスタムモデルを設定、データの流れを管理できる。SAML SSO認証で組織のセキュリティポリシーに従う設定も可能です。

まとめ

Superwhisperは、単なる音声入力ツールではありません。あなたの「話し言葉」の意図を汲み取り、プロレベルの「書き言葉」へ瞬時に変換する、AIライティング・パートナーです

Superwhisperを使うことにより、キーボードを叩くという「肉体労働」から解放され、思考のスピードでアウトプットできるようになります。特にAppleシリコン(M1〜M4チップ)搭載のMacをお使いであれば、その処理速度の恩恵を最大限に受けられるはずです。

ローカルモデル利用時はPC・iPhone内で処理が完結するため、プライバシー配慮が必要な用途にも活用しやすいアプリです。あなたの知的な仕事を強力にサポートします。

まずは無料版で自分のPC/iPhoneにインストールしてみませんか?

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次