Stability AI、「Stable Diffusion 3 Medium」をリリース

Stability AIは、テキストから画像を生成する最新モデル「Stable Diffusion 3 Medium」を発表しました。このモデルは従来よりも高性能でありながら、家庭用のパソコンやノートパソコンでも快適に動作するように設計されています。企業向けのGPUにも対応しています。

Stable Diffusion 3 Mediumは、20億のパラメータを持ち、より高画質でリアルな画像を生成できます。特に、人物の手や顔の表現において、従来のモデルでは難しかったリアルさを実現しています。これは、16チャネルVAEなどの最新技術によって実現しました。また、複雑で長い文章の指示を理解する能力も向上しており、入力した文字の誤りや、文字の大きさ、文字間隔の修正も正確に行うことができます。

このモデルは、高い処理能力を持つGPUを搭載していなくても、標準的なパソコンで十分な性能を発揮します。さらに、少ないデータからでも詳細な情報を学習できるため、ユーザーの好みに合わせたカスタマイズも容易です。

Stability AIは、NVIDIAおよびAMDと連携し、このモデルの性能を最大限に引き出すための最適化を行いました。NVIDIAのRTX GPUとTensorRTを活用することで、処理速度が50%向上しました。AMDも同様に、最新のAPU、家庭用GPU、企業向けGPUでの処理を最適化しています。

Stable Diffusion 3 Mediumは、「Stability Non-Commercial Research Community License」のもとで公開されており、誰でも自由に利用できます。また、ビジネス用途で利用したいプロのアーティストやデザイナー、開発者向けに、新たに「Creator License」が用意されました。企業が大規模なビジネスで活用できる「Enterprise License」に関しては問い合わせ対応となります。

Stability AIは、安全で責任あるAIの開発と利用を重視しており、悪用を防ぐための対策を多数実施しています。社内外の専門家によるテストや、被害を防ぐための安全対策などです。今後も、研究者や専門家、コミュニティと協力しながら、モデルの改善と技術革新を進めていきます。

Stability AIは、ユーザーからのフィードバックを参考に、Stable Diffusion 3 Mediumの機能拡張や性能向上を図る予定です。このモデルが、AIによる画像生成の新しい基準となり、プロ・アマ問わず、多くのユーザーにとって重要なツールとなることを目指しています。最新の進捗状況は、Twitter、Instagram、LinkedIn、Discordコミュニティで発信していきます。

Stability AIの「Stable Diffusion 3 Medium」は、生成AIの未来を創造していくためのモデルです。今後の発展にご期待ください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次