Anthropicから最新AIモデル「Claude Opus 4.1」が公開―コーディング性能を向上

出典:Claude Opus 4.1 \ Anthropic

米AI開発企業のAnthropic(アンソロピック)は2025年8月6日、主力AIモデル「Claude Opus」の最新バージョンとなる「Claude Opus4.1」を発表しました。従来のOpus4をベースに、エージェント型のタスク処理能力やプログラミングの精度、リサーチおよび推論の性能を強化しつつ、料金は据え置かれました。

Opus4.1は、ソフトウェアのバグ修正能力を測定するベンチマーク「SWE-bench Verified」74.5%というスコアを達成しました。これは前バージョンの72.5%を上回る結果です。技術ライター兼開発者のサイモン・ウィリソン氏は、この改善を「バージョン番号が示す通り、大きな飛躍ではなく、堅実なアップデート」と評価しています。

新しいモデルはAnthropicのAPIに加え、Amazon BedrockやGoogle CloudのVertex AIで即日利用可能となっています。また、GitHubはコード支援ツール「Copilot Chat」において、EnterpriseおよびPro+ユーザー向けに段階的に導入を開始しました。従来のOpus 4モデルは15日後に提供を終了する予定です。

料金体系については、入力100万トークンにつき15ドル、出力100万トークンにつき75ドルと、以前と変わりませんが、バッチ処理やプロンプトキャッシングを活用することで最大90%のコスト削減が可能だと説明されています。

今回のアップデートについて、実際の利用者からの評価も集まっています。楽天グループの機械学習エンジニアである成瀬健太氏は「大規模なコードベースでも的確な修正箇所を見極める能力が向上し、作業時間が最大50%短縮された。不要な変更やバグの混入も減り、ツールの使用頻度も45%ほど減少した」と述べ、高く評価しました。

また、Windsurfのジェフ・ワンCEOは「自社のジュニア開発者向けテストで、Opus 4と比較して1標準偏差の性能改善が見られた。Sonnetモデルが3.7から4へアップデートした際の性能向上と同程度の印象を受ける」とコメントしています。

GitHubのチーフ・プロダクト・オフィサー、マリオ・ロドリゲス氏も「初期の社内テストでは、複数のファイルにまたがるコードのリファクタリング(構造整理)の場面で特に顕著な性能向上が確認できた」と述べ、実務上のメリットを強調しています。

専門家からは「劇的な進化ではないが、長時間に及ぶ複雑なタスクや、大規模なコードの修正・改善といった現場の実務には十分に対応できる水準」との評価が相次いでおり、今後、幅広い用途での活用が期待されています。


出典:Claude Opus 4.1 \ Anthropic

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次