Google、最新画像モデル「Gemini 2.5 Flash Image」を公開

出典:Google Developers Blog

Googleは8月26日、最新の画像生成・編集モデル「Gemini 2.5 Flash Image」を発表しました。同モデルは「nano-banana」というユニークな別名を持ち、従来モデルから大幅に進化した機能を提供しています。

Gemini 2.5 Flash Imageの特長のひとつは、複数の画像を自然に融合できることです。例えば、部屋の内装を好みの色やテクスチャーに変更したり、別々に撮影した製品画像を1つのシーンに合成したりと、ユーザーのニーズに応じた編集が簡単にできます。

出典:Google Developers Blog

また、キャラクターや商品の外観を統一的に保つことが可能となり、同一キャラクターを異なる背景に登場させたり、製品を多方向から一貫したイメージで表現したりするのにも適しています。

出典:Google Developers Blog

さらに、自然な言葉による細かな編集ができる点も大きな進化です。背景だけをぼかす、人や物を写真から削除する、ポーズを調整するといった精密な編集を、専門的な技術なしに自然言語の指示で行えます。

同モデルでは画像生成においてもGoogleが保有する実世界の豊富な知識を活用。手描きの図表を理解して編集したり、複雑な指示を正確に画像へ反映させたりできるようになりました。これにより教育分野やビジネス用途など、幅広い領域での活用が期待されます。

出典:Google Developers Blog

Gemini 2.5 Flash Imageは現在、Gemini APIやGoogle AI Studioを通じて一般ユーザーも無料で体験可能です。さらに開発者向けにはVertex AIを通じて提供され、100万出力トークンあたり30ドル(画像1枚あたり約0.039ドル)で利用できます。

またGoogleはOpenRouter.aiやfal.aiなどの外部開発者プラットフォームとの連携を強化しており、多くの開発者が容易に同モデルを活用できる環境を整えています。

なお、同モデルで作成された画像には「SynthID」というデジタル透かしが自動的に埋め込まれ、AIによる生成・編集画像であることが判別可能になっています。Googleは今後も、画像の詳細表現や長文テキストのレンダリング精度向上など、さらなる改良を進めるとしています。


出典:Introducing Gemini 2.5 Flash Image, our state-of-the-art image model – Google Developers Blog

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次