Anthropic、Claude Opus 4とSonnet 4を同時発表 Claude Codeで開発環境を刷新

出典:Code with Claude Opening Keynote – YouTube

米AI企業Anthropicは日本時間2025年5月23日、同社初の開発者向けイベントをオンライン開催し、次世代大規模言語モデル「Claude Opus 4」と「Claude Sonnet 4」を公開しました。

両モデルはウェブ版ClaudeおよびAPI経由で即日利用が可能で、瞬時に応答するモードと深い推論を行う「Extended thinking(拡張思考)」モードを組み合わせたハイブリッド構成を採用しています。

イベントでは、モデル刷新に加えてAPI機能の大幅拡張とAIコーディングアシスタント「Claude Code」の一般提供開始が一挙に発表され、開発者コミュニティの注目を集めました。

Anthropicが「世界最高のコーディングモデル」と位置づけるOpus 4は、複雑なオープンソースプロジェクトにおいて約7時間にわたり自律的にコードを書き続けた事例が紹介されました。楽天の梶雄介氏は「AI能力の大きな飛躍だ」とコメントし、エンジニアリング現場での即戦力を強調しました。

出典:Code with Claude Opening Keynote – YouTube

Sonnet 4は従来版3.7から推論精度を大幅に引き上げ、長時間タスクでも安定した性能を維持します。

性能指標として、ソフトウェア工学タスクを測定する「SWE-bench verified」でOpenAI o3やCodex-1、Gemini 2.5 Proを上回るスコアを記録しました。

出典:Introducing Claude 4 \ Anthropic

大学院レベルの推論試験「GPQA Diamond」では79.6%(Extended利用時83.3%)、多言語一斉試験「MMLU」では88.8%、高校数学競技会「AIME」では75.5%(同90.0%)を達成し、幅広い分野での優位性を示しています。

出典:Introducing Claude 4 \ Anthropic

Extended thinkingモードは外部ツール呼び出しを組み込み、検索や計算処理を必要に応じて自動実行します。複数ツールを並列利用できるほか、許可されたローカルファイルへのアクセスや強化されたメモリ機構により、長大な文脈でも一貫性を保った応答を生成します。モデルは指示追従性の向上と「近道行動」の65%削減を達成しており、タスク実行の安全性と信頼性を高めました。

安全面ではASL-3(AI Safety Level 3)に準拠した保護措置を実装し、リスク低減と透明性向上を図っています。さらに、思考プロセスを要約表示する「思考サマリー」により、ユーザーは長い推論過程の概要を迅速に把握できます。詳細な連鎖思考を確認したい開発者向けには問い合わせ制の「Developer Mode」が用意され、プロンプトエンジニアリングに活用できる点も特徴です。

APIにはAIエージェント開発を加速する4つの新機能がβ版として追加されました。第一に「Code execution tool」は安全なPythonサンドボックスでコードを実行し、金融モデリングや統計解析などを対話的に完結させます。

第二の「MCP connector」はURLを指定するだけで外部Model Context Protocolサーバーと接続し、ZapierやAsanaなどのツールを介したワークフロー自動化を容易にします。

出典:Code with Claude Opening Keynote – YouTube

第三の「Files API」はアップロード済み文書を複数セッションで再利用でき、Code executionと連携してデータ可視化を実現します。

第四の「拡張プロンプトキャッシュ」はキャッシュ有効期間を最長1時間まで延長し、長時間稼働エージェントのコストとレイテンシを大幅に削減します。

従来のWeb検索ツールもExtended thinkingと統合されました。Claudeは検索実行の最適タイミングを自律判断し、回答に引用を自動付与します。さらに、ドメインフィルタやローカライズ設定が追加され、企業ポリシーに沿った情報取得や地域特化検索が可能になりました。

同時に一般提供が始まった「Claude Code」は、ターミナル主体のAIコーディングアシスタントです。プロジェクト全体を理解したうえで、自然言語指示によるコード生成、テスト、lint、Git操作、Web検索を実行し、開発効率を高めます。VS CodeやJetBrains IDEsと統合され、ショートカット起動や差分ビュー表示、エラー共有に対応しました。ユーザーはIDE上で選択したコード範囲をそのままClaude Codeへ渡し、修正提案を即座に受け取れます。

GitHub PR上ではClaude Codeがレビューコメントを解釈し、CIエラーを自動修正してコードを書き換えます。レビュアーは“タグ付け”するだけで修正を委ねられるため、プルリクエストの周回が短縮され、チーム全体の開発サイクルが高速化します。

今回の大型アップデートは、従来の対話的AIから“エージェントAI”へ移行する潮流を一段と押し進めるものです。

Claude 4モデル群はコーディング支援、研究支援、ビジネス分析など多岐にわたる分野で人間の思考を補完し、APIとツールの拡張によって開発者はインフラ準備に煩わされることなく高度なアプリケーションを構築できるようになりました。Anthropicは「AIの信頼性と透明性」を掲げ、性能向上と安全設計の両立を追求しています。

AIモデルの性能競争が激化するなかで、今回の発表は「AIが自ら思考し、外部資源を組み合わせ、実行まで担う」統合型プラットフォームの完成形を示したと言えます。今後、先進的なAIエージェントを用いた業務自動化や研究開発のスピードアップが進む一方、AIの責任ある活用をめぐる議論も一層重要になるでしょう。開発者と企業にとって、Claude 4と新API群、Claude Codeの組み合わせは、AI時代における競争力を左右する鍵となりそうです。


出典:Introducing Claude 4 \ Anthropic
出典:Code with Claude Opening Keynote – YouTube

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次