
AIはどんどん進化していて、Googleが作った最新のAI「Gemini 2.0 Flash Thinking Experimental」が話題になっています。
このAIは、考える過程を目で見てわかるようにしたり、難しい問題を解いたり、文章と画像を一緒に扱えたりする便利な機能を持っています。
さらに、今現在はGoogle AI Studioで無料で使えるでの気軽に試せることが魅力です。
この記事では、その特徴や使い方、料金、ChatGPT o1との違いをわかりやすく説明していきます。
Gemini 2.0 Flash Thinkingとは?機能や特徴

Gemini 2.0 Flash Thinkingは、Googleが開発したAIの新しいモデルです。
今までのAIよりも賢くて、どのように考えて答えを出したのかが見えるのが特徴です。
GoogleのCEOも「これまでで最もすごいAIだ」と言っています。
従来のAIは、答えを出す過程がブラックボックスのようになっており、なぜその答えが出たのかを理解するのが難しかったですが、Gemini 2.0 Flash Thinkingはその課題を克服しました。
Gemini 2.0 Flash Thinkingは、現在実験版のため「Gemini 2.0 Flash Thinking Experimental」という名称で運用されていますが、本記事では統一して「Gemini 2.0 Flash Thinking」で表記します。
思考プロセスの可視化
このAIの注目すべきところは、「考え方」が見えることです。
普通のAIは、どうやって答えを出したのかがよくわかりません。
しかし、Gemini 2.0 Flash Thinkingなら、答えを出すまでの過程を段階ごとに表示してくれます。

例えば、数学の問題を解くときに、答えだけじゃなくて途中の計算方法も見せてくれるので、「どうやってこの答えになったのか?」がわかるようになります。
勉強にも役立つ機能です。
この機能があることで、間違った答えが出たときにどこで間違えたのかを確認することもできるので、ユーザーがAIの推論をチェックしやすくなります。
複雑なタスクへの対応力
このAIは、単純な質問に答えるだけでなく、より複雑で専門的な問題にも対応できるのが特徴です。
例えば、以下のような問題です。
- 数字を足したり引いたりして特定の数を作る数学のパズル問題
- さまざまなシナリオを想定した統計分析
- 物理学や化学に関する計算問題、例えば電子のエネルギーレベルの計算や化学反応の予測
- プログラミングのバグを検出し、最適な修正方法を提案するコード分析
- 建築設計やプロダクトデザインに関するアイデア出し、最適化のアドバイス
普通のAIはこうした高度な問題を解くのが難しい場合がありますが、Gemini 2.0 Flash Thinkingなら、問題を細かく分解し、複数の視点から考えることで、より正確な答えを導き出すことができます。
例えば、数学的な推論では、単に答えを出すだけでなく、どのような手順でその答えにたどり着いたのかを示すことができるため、教育分野でも活用できます。
また、コーディングのバグ修正では、問題の原因を特定し、適切な修正方法を提案するだけでなく、なぜその修正が必要なのかを説明することも可能です。
マルチモーダル対応で画像の分析が可能
Gemini 2.0 Flash Thinkingは、文字だけじゃなくて、画像も一緒に分析できるのが大きな特徴です。
例えば、以下のようなメリットや問題解決ができます。
- 写真に写っている人の気持ちを推測する:表情や姿勢を分析し、「喜び」「悲しみ」「驚き」などの感情を判定します。SNSの投稿管理や、マーケティング分析にも活用できます。
- 数学の図形問題を解く:図形の特徴を認識し、三角形や円の面積を求める問題などを自動解決します。例えば、受験対策アプリで図形問題の解説を提供する機能に応用できます。
- 商品画像を分析し、似た商品を探す:例えば、ファッションアイテムの画像を解析し、オンラインストアで類似商品の検索が可能になります。また、価格比較サイトでも類似商品の検索やレコメンド機能の向上に役立ちます。
- 風景の写真から、場所を特定する:街並みやランドマークを識別し、撮影された場所を特定します。旅行アプリや地理学の研究に利用できるかもしれません。
- スキャンした文書の内容を解析する:書類や手書きメモをデジタル化し、重要な情報を抽出します。会議メモの自動要約や、文書の翻訳機能にも応用できます。
このように、画像解析技術を活かした応用は多岐にわたります。
特にECサイトでは、商品の写真を分析して、ユーザーに最適な商品を提案するレコメンドシステムの強化が可能です。
また、教育分野では、数学の図形問題や手書きノートのデジタル化などにも利用されており、AIの活用範囲がますます広がっています。
GoogleマップやYouTubeと公式連携
Gemini 2.0 Flash Thinkingには「Gemini 2.0 Flash Thinking Experimental with apps」というYouTubeやGoogleマップ、Google検索で使用可能な専用モデルも存在します。
例えば「最新のAI技術について検索して」とお願いした場合に、そのまますぐWEBブラウジングに入るわけではなく、一度推論を行いユーザーの意図をしっかり把握・整理した上で検索を行います。

YouTubeやGoogle検索に関する内容でGeminiを使う場合は、「Gemini 2.0 Flash Thinking Experimental with apps」のモデルを選択しましょう。
Gemini 2.0 Flash Thinkingの料金プランは無料

元々Gemini 2.0 Flash Thinkingは開発者向け環境のGoogle AI Studioでのみ利用可能でしたが、現在は一般公開され、Geminiアプリ経由でも全ユーザーが無料で利用可能です。
またAPIも提供されていますので、APIを活用することでチャットボットやデータ分析ツール、クリエイティブなコンテンツ生成ツールなど、さまざまな用途に応用することができます。
現在Gemini 2.0 Flash Thinkingは無料でも利用可能ですが、有料プランのGemini Advancedにアップグレードすれば Gemini 1.5 Pro や Gemini 1.5 Pro with Deep Researchなど、無料プランでは使えないプランも利用可能になります。
Gemini Advancedについては以下の記事で解説していますので、興味がある方はアップグレードも検討してみてください。

Gemini 2.0 Flash Thinkingの始め方と使い方

ここでは、始め方と使い方の手順を紹介します。
完全無料で最新AIモデルがGoogle AI Studioでの利用方法をご紹介します。
右側のモデル選択メニューで「Gemini 2.0 Flash Thinking Experimental」を選びましょう。

テキストを入力します。

画像やファイルを使用する場合は、アップロードボタンをクリックして画像を追加しましょう。

「Run」ボタンを押すと、AIが回答してくれます。

AIの出力が表示されるので、内容を確認しましょう。

大量のデータを扱う場合は、分割して処理することで、より正確な結果を得られる可能性があります。
Gemini 2.0 Flash ThinkingとChatGPT o1を比較!違いは?

AIを比べるサイト「Chatbot Arena」の評価では、Gemini 2.0 Flash Thinkingの方がスコアが現在は高いです。

でも、このランキングは頻繁に変わるので、常に上位とは限りません。
Gemini 2.0 Flash Thinkingは、考え方が見える機能と画像も使える機能があるので、特に複雑な問題に強いのが特徴です。
一方で、ChatGPT o1は自然な会話が得意だったり、特定の分野で強みを持っていたりするので、それぞれのAIの特性を理解して使うのが大事です。
まとめ
Gemini 2.0 Flash Thinkingは、Googleが開発した新しいAIで、考え方が見える、難しい問題が解ける、画像も使えるというすごい機能を持っています。
今ならGoogle AI Studioで無料で使えますが、将来は有料になるかもしれません。
ChatGPT o1と比べても高評価を得ていて、特に難しい問題を解くのが得意です。
これからさらに進化が期待されるAIなので、ぜひ一度使ってみてください。