Anthropic、ハイブリッド推論AI「Claude 3.7 Sonnet」を発表 ポケモンで能力を証明

出典:Claude 3.7 Sonnet and Claude Code \ Anthropic

米AI企業のAnthropicは、新たなハイブリッド推論モデル「Claude 3.7 Sonnet」を発表しました。

このモデルは、即時の回答と熟考した回答を切り替えることが可能で、従来モデルより高度な推論能力を備えています。

Claude 3.7 Sonnetの最大の特徴は、「Extended Thinking Mode」(拡張思考機能)と呼ばれる機能です。

これにより、通常の素早い応答に加えて、問題に応じた思考時間を確保し、より正確な回答を導き出すことができます。

出典:Claude 3.7 Sonnet and Claude Code \ Anthropic

Claude 3.7 Sonnetでは、AIの思考過程を可視化する新機能が導入されました。

これにより、ユーザーはAIがどのように結論を導き出したのかを確認できるようになり、透明性が向上します。

ただし、この機能には安全上の懸念もあり、悪意のあるユーザーによるモデルの解析や、AIが特定の思考を隠す可能性についての議論も続いています。

Anthropicは、機密性の高い内容が思考過程に含まれる場合、暗号化して表示を制限する対策を講じています。

また、API利用者は「思考時間の予算」を設定することもでき、計算コストと精度を柔軟に調整可能です。

新モデルの性能向上を示すユニークなテストとして、ゲームボーイ用ソフト「ポケットモンスター 赤」をプレイさせる実験が行われました。

前世代のClaude 3.0 Sonnetでは、ゲーム開始地点の「マサラタウン」から出ることができませんでしたが、Claude 3.7 Sonnetは3人のジムリーダーと戦うレベルまで進行しました。

出典:Claude’s extended thinking \ Anthropic

この結果は、モデルがより高度な問題解決能力を持ち、試行錯誤を重ねながら最適な行動を学習する能力が向上していることを示しています。

同時に、AnthropicはAIコーディングツール「Claude Code」のリリースも発表しました。

Claude Codeはコマンドラインツールとして動作し、開発者がAIを活用してコードを生成・編集・デバッグできるようになります。

GitHubとの統合機能もあり、開発の効率化が期待されます。

Claude 3.7 Sonnetは、無料プランを含むすべてのプランで利用可能で、Amazon BedrockやGoogle CloudのVertex AIでも提供されています。

しかし、Extended Thinking Modeは有料プラン限定となっています。

また、APIでの利用料金は、100万入力トークンあたり3ドル、100万出力トークンあたり15ドルに設定されています。

この最新のAIモデルと新機能は、開発者や研究者にとって大きな進歩をもたらすと考えられています。

今後もAnthropicはAIの推論能力や安全性を向上させる研究を続ける方針です。


出典:Claude’s extended thinking \ Anthropic
出典:Claude 3.7 Sonnet and Claude Code \ Anthropic

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次