OpenAI、BroadcomとLLM推論向けAIチップ「Jalapeño」を発表

出典:OpenAI and Broadcom unveil LLM-optimized inference chip | OpenAI

米OpenAIは6月24日、Broadcomと共同で開発した同社初のAI推論アクセラレータ「Jalapeño(ハラペーニョ)」を発表しました。大規模言語モデル(LLM)の推論処理に特化した「Intelligence Processor」と位置付けるチップで、ChatGPT、Codex、API、将来のエージェント型製品で得た運用知見を設計に反映したといいます。

Jalapeñoは、従来のAI用途向けアクセラレータを転用するのではなく、現代的なLLM推論のためにゼロから設計されました。OpenAIはモデルのロードマップ、カーネル、推論提供システム、製品要件への理解を基にアーキテクチャを構築し、演算、メモリー、ネットワークの資源配分を最適化。データ移動を抑えることで、理論上のピーク性能により近い実利用率を目指すと説明しています。

開発はBroadcom、Celesticaと進めました。OpenAIがチップ設計を主導し、Broadcomは半導体実装やTomahawkネットワーキングシリコンを含むネットワーク技術を、Celesticaは基板、ラック、システム統合を担います。OpenAIによると、初期設計から製造用データを確定するテープアウトまでの期間は9か月でした。設計・最適化の一部ではOpenAIのモデルも活用し、高性能先端半導体向けASICとして史上最速の開発サイクルになったと同社はみています。

量産目標の周波数と消費電力で動くエンジニアリングサンプルは、研究室内で機械学習ワークロードを実行しており、GPT-5.3-Codex-Sparkも稼働しているといいます。最終性能の測定は継続中ですが、初期テストでは、現行の最先端製品を電力当たり性能で大幅に上回る見通しを示しました。詳細な技術報告は今後数か月以内に公表する予定です。

同社はJalapeñoを、製品、モデルに続き、チップまで含めて自社で最適化するフルスタック戦略の一環と位置付けます。2026年末までに初期展開を始め、Microsoftなどのデータセンターパートナーとギガワット規模での導入を見据えます。推論コスト、速度、信頼性の改善を通じて、ChatGPTの応答高速化、Codexの処理能力向上、API利用企業の開発コスト低減、需要増加時の安定提供につなげる考えです。OpenAIは、より多くの学生、開発者、中小企業、研究者、企業が、高度なAIを利用しやすくすることを目標に掲げています。


出典:OpenAI and Broadcom unveil LLM-optimized inference chip | OpenAI

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次