
「NotesGPT」はOpenAIの音声認識モデル「Whisper」の技術を使用した、無料で音声データの文字起こしができるツールです。
この記事では、NotesGPTのサービス概要や無料で文字起こしを行う方法をステップごとに解説します。また、他の文字起こしツールとの比較も行い、それぞれの利用シーンに合った最適な文字起こしツールを紹介します。
NotesGPTとは?Whisperの文字起こしが無料で使える

NotesGPTは、音声の録音から文字起こし、要約、アクションリストの抽出まで、1つのツール内で完結できる点が特徴であり、音声の書き起こし部分には、OpenAIの音声認識モデルであるWhisperの技術を使用しています。
さらに、NotesGPTはGitHubでオープンソースでも提供されており、誰でもソフトウェアの利用やカスタマイズが可能です。
NotesGPTの概要(ブラウザ録音+自動文字起こし)
NotesGPTの最大の特徴は、ブラウザひとつで「録音・文字起こし・要約・タスク抽出」までが完結するシームレスな体験にあります。
サイトにアクセスしてログインし、音声レコードの録音ボタンを押して話すだけで、音声の文字起こし、内容の要約、そしてネクストアクションの抽出という一連の処理が全自動で行われます。
なお、音声ファイルのアップロード機能は実装されておらず、ブラウザ上でのリアルタイム録音に特化したツールです(2025年12月時点)。
対応言語と出力言語(文字起こしは多言語/要約は英語)
音声認識エンジンには「Whisper」が採用されているため、日本語を含む多言語の文字起こしに高精度で対応しています。
ただし、要約とアクションアイテムの出力言語については注意が必要です。文字起こし自体は日本語で出力されますが、要約やアクションアイテムは英語で生成されます(2025年12月時点)。
英語学習やグローバルなメモ作成には便利ですが、完全な日本語ツールとして使うには、後述するオープンソース版でのカスタマイズが必要になる場合があります。
Whisper large-v3とLLMによる要約・Action Items生成
音声の聞き取りには、高い精度を持つOpenAIの「Whisper large-v3」を採用しているため、専門用語が混じる会議や早口の議論でも正確にテキスト化します。さらに重要なのが、その後の要約とタスク抽出です。ここには「Mixtral」という、文脈理解に非常に優れた高性能なAIモデルが使われています。
つまり、単に言葉を拾って並べるだけでなく、「誰が、いつまでに、何をやるべきか」という文脈をAIが正しく理解し、整理してくれることを意味します。人間が手直ししなくても、そのままチームへの共有事項として使えるレベルのアウトプットが期待できるため、議事録作成にかかる時間を大幅に削減できる実用的な構成となっています。
ベクター検索でノートを横断検索できる
音声メモを日常的に使っていると、データが増えすぎて「あの話、どこだっけ?」と過去のログが見つからなくなる問題が発生します。通常の検索機能では「予算」や「A社」といったキーワードが完全に一致しないとヒットしませんが、NotesGPTは「ベクター検索」という技術でこれを解決しています。
これは、文章の意味を理解して検索する機能であり、たとえば具体的な単語を忘れてしまっても、「先月のプロジェクトの進捗について話した内容」といった曖昧なニュアンスや文脈で検索をかければ、AIが関連性の高いメモを候補として提示してくれます。
人間の記憶の曖昧さをAIがカバーしてくれるため、過去の会話が埋もれることなく、いつでも取り出せるナレッジとして活用できます。
無料&オープンソースという特徴と注意点
NotesGPTは完全無料で提供されています。さらに、プログラムの設計図であるソースコードが公開されているため、セキュリティに厳しい企業であれば自社のエンジニアが社内専用の環境として構築し直すことも可能です(2025年12月時点)。
注意点として、名前が非常によく似た「NoteGPT」という別サービスが存在します。
NoteGPTはYouTube動画の要約などを強みとする多機能ツールであり、NotesGPTとは提供形態も用途も異なります。社内で案内する際は、誤って有料の別サービスに登録してしまわないよう、「s」がついている「NotesGPT」であることを必ず確認するように周知してください。
NotesGPTの使い方をステップごとに解説

NotesGPTの操作は極めて直感的で、複雑なマニュアルを読み込む必要はほとんどありません。アカウント作成から実際の録音、そしてタスク化までのフローは簡易的であり、初めて触る方でも迷うことなく使いこなせる設計になっています。
この章では、その具体的な手順を実際の画面の流れに沿って解説します。
「Record a New Voice Note」をクリックして、新規の音声データを録音します。

マイクのアイコンをクリックすると、音声データの録音を開始・終了できます。文字起こしについては、日本語の音声データにも対応しています。

録音を停止すると、すぐにAIによる解析が始まります。まずは音声認識モデル「Whisper large-v3」によって、話した内容がテキスト化されます。
このモデルは多言語に対応しているため、日本語で話した内容も高い精度でそのまま日本語のテキストとして書き起こされます。誤字脱字の修正などを手動で行う必要がほとんどないレベルで出力されるため、議事録の素案として十分に活用可能です。

文字起こしとほぼ同時に、裏側ではLLMがテキストの内容を解析しています。画面左側には、会話の議事録である「Transcript」と全体の要約である「Summary」が表示され、タブを切り替えることで表示を変更することができます。
右側には、抽出されたやるべきタスク「Action Items」が表示されます。ここで生成される要約とタスクリストは、現状の仕様では英語で出力されます(※2025年12月時点)。

画面右下の「View All Action Items」をクリックすると、複数の音声データから抽出したアクションリストを一覧として見ることができます。


NotesGPTがおすすめな人・おすすめでない人

NotesGPTは「ブラウザ録音への特化」や「英語による要約出力」といった明確な仕様上の特徴を持っています。そのため、あらゆる場面で万能なツールというわけではなく、利用目的によって適合するケースが明確に分かれます。
導入後のミスマッチを防ぐため、具体的にどのようなユーザーやシーンに適しているかを整理します。
NotesGPTは個人利用・英語要約が欲しい人に向いている
NotesGPTは、個人の備忘録やアイデア出し、あるいはエンジニアや開発者の実験的な利用に最適です。特に、自分の話した日本語が即座に英語で要約されるため、英語学習中の方や海外メンバーを含むグローバルチームへの共有メモを作成したい方にとっては、翻訳の手間が省ける強力な武器になります。
また、オープンソースとしてコードが公開されているため、自社のサーバーに構築してカスタマイズしたい技術者にとっても非常に価値のあるベースモデルとなります。
NotesGPTは日本語で業務フローを完結させたい法人には不向き
純粋な日本国内の業務において、会議の議事録作成を効率化したいと考えている法人にはあまり推奨できません。要約とタスクが英語で出力されるため、上司やチームメンバーに共有する前に日本語へ翻訳し直す作業が発生し、かえって工数が増える可能性があります。
加えて、ICレコーダーで録音した外部ファイルの取り込みができないため、「重要な会議は専用機で録音し、後でテキスト化する」という一般的な企業の運用フローには組み込みにくいのが実情です。日本語での完全な自動化とファイルインポートを求める場合は、他の有料サービスの利用を検討すべきです。
法人利用ならNotionやSalesforceとの連携もある「Notta」

Nottaは、高精度なAI音声認識を活用した自動文字起こしサービスで、リアルタイム文字起こしや翻訳機能を提供し、自動で議事録を作成することができます。
主な機能は以下の通りです。
| 主な機能 | 説明 |
|---|---|
| リアルタイム文字起こし | Zoom/Google Meet/Microsoft Teams/WebexなどのWeb会議やSlack連携に対応。 リアルタイム自動文字起こし。 会議終了後すぐに要約やアクションアイテムを生成。 |
| 音声ファイルの文字起こし | 録音した音声や動画ファイルを自動的にテキスト化。 編集・検索・共有が可能。 |
| 多言語対応 | 58言語の文字起こしに対応。 英日など2言語を同時に処理するバイリンガル文字起こし。 自動翻訳機能も利用可能(一部はアドオン扱い)。 海外との会議や多言語インタビューでも1つのツールで完結。 |
| エクスポート機能 | TXT/Word/PDF/SRTなどの形式でエクスポート。 NotionやSlack、メールなどに直接共有可。 |
| チームワークスペース | Business/Enterpriseプラン 共有ワークスペースやユーザー権限管理、利用状況レポートなどの管理機能。 SalesforceやHubSpot、ZapierなどのCRM連携も可。 |
Nottaの各種料金プランを比較しました。
| 項目 | Free | Premium | Business | Enterprise |
|---|---|---|---|---|
| 月額料金 | 無料 | ¥1,980 | ¥4,180 | 要問い合わせ |
| 年額料金 | 無料 | ¥14,220 (1,185/月) | ¥30,096 (2,508/月) | 要問い合わせ |
| 文字起こし時間 (月間) | 120分 | 1,800分 | 無制限 | カスタマイズ |
| 1回の録音上限 | 3分まで | 5時間まで | 5時間まで | 5時間まで |
| AI要約 (月間) | 10回 | 100回 | 200回 | 無制限 |
| ファイルアップロード (月間) | 50回 | 100回 | 200回 | 無制限 |
| 主な独自機能 | ・リアルタイム文字起こし ・話者識別 ・Zoom等連携 | ・データの出力 ・翻訳機能 ・カスタム辞書登録 | ・Web会議のビデオ録画 ・Salesforce/Zapier連携 ・管理者/セキュリティ機能 | ・SAML SSO ・監査ログ ・AI学習へのデータ利用なし |
| 対象ユーザー | お試し・初心者 | 個人 | チーム・企業 | 大規模組織 (51名以上〜) |
ChatGPTでは対応していない「Web会議への自動参加」と「正確な話者識別」が可能で、ZoomやTeamsなどのオンライン会議が業務の中心であればNottaがおすすめです。
会議中にリアルタイムで文字起こし内容をチームで共有・編集できるため、PCでのデスクワークが多く「会議終了と同時に議事録を完成させたい」方に最適です。
\ 無料お試し実施中 /
ボイスレコーダーから一気通貫で文字起こしするなら「Plaud Note」

Plaud Noteは、Nicebuild LLCによって開発されたAIボイスレコーダーで、特にGPT-5.2などの最新のAIと連携している点が特徴です。
このデバイスは、録音、文字起こし、議事録作成を一体化したオールインワンのAI録音アシスタントとして設計されています。主な機能は以下の通りです。
| 主な機能 | 説明 |
|---|---|
| ワンタッチ録音 | 本体のボタンを長押しするだけで録音を開始・終了。 カード型のPlaud Note/Note Proはスマホの背面にマグネットで装着して通話録音可。 Note Proでは「重要なところだけボタンを押してハイライトする」といった操作にも対応。 |
| 文字起こしと要約 | 自動文字起こしと1万種類以上のテンプレートを使った要約・議事録・ToDoリスト・インタビュー要約などに変換。 スピーカーラベルや業界別用語集にも対応しており、ビジネス用途の会議録にも使用可能。 |
| 多言語対応 | 112言語の文字起こしに対応。 AIが文脈を解析し、専門用語が含まれる会話でも高い精度で認識・翻訳。 |
| エクスポート機能 | 音声:MP3/WAV 文字起こし:TXT/DOCX/PDF/SRT ノート:TXT/Markdown/DOCX/PDF マインドマップ:JPEG/Markdown |
| チームワークスペース | 無し |
Plaud Noteシリーズをデバイスごとに比較しました。
| 項目 | Plaud Note | Plaud NotePin | Plaud Note Pro |
|---|---|---|---|
| 本体価格 | 27,500円 | 27,500円 | 30,800円 |
| 形状・デザイン | カード型 | カプセル型 (ウェアラブル) | カード型 |
| 装着・携帯方法 | MagSafeでスマホ背面に吸着。 専用ケースあり。 | マグネットピン、クリップ、ネックストラップ、リストバンド | MagSafeでスマホ背面に吸着。 専用ケースあり。 |
| 主な用途 | ・スマホ通話の録音 ・対面会議の記録 | ・移動中のメモ ・アイデアの即時記録 ・より身軽な常時録音 | ・高品質な通話・会議録音 ・ビジネス利用の強化版 |
| 特徴 | スマホと一緒に持ち運び可。 急な通話録音に対応しやすい定番モデル。 | 衣服や体に取り付けてハンズフリーで録音可能。 アクセサリー感覚で使える。 | NOTEの基本機能に加え、マイク性能や処理速度が向上したプロ仕様。 |
| 公式サイト | 公式サイト | 公式サイト | 公式サイト |
また、PLAUDのデバイスを購入すると、全員に文字起こし機能が月間300分付与されます。300分以上機能を利用したい場合は別途サブスクリプションを契約する必要があります。
ChatGPTでは録れない「スマホ通話の録音」機能と、「物理スイッチ」による録音は、ハードウェアならではの圧倒的な強みです。
PCを開けない対面商談や、突発的な電話対応が多い営業職・現場仕事の方にとって、録り逃しをさせない「第二の記憶」としておすすめできるアイテムです。
\ 公式LINEからクーポン配布中 /
まとめ
NotesGPTは、無料で利用できるオープンソースの音声AIツールであり、ブラウザ一つで録音からタスク抽出までを完結できる手軽さが最大の特徴です。さらに、最新のWhisper large-v3やMixtralモデルを搭載することで無料ツールとは思えない高い認識精度と文脈理解力を実現しています。
一方で、要約が英語で出力される点や、既存ファイルのアップロードができない点には注意が必要です。
導入を検討する際は、これらの特性が自身の利用目的に合致しているかをよく確認してください。また、有料の別サービス「NoteGPT」と混同する可能性があるため、アクセスの際はサービス名を正確に確認することをお勧めします 。

