Anthropic、未公開モデル「Claude Mythos Preview」を発表 重要ソフトの脆弱性検出で高い性能

出典:Project Glasswing: Securing critical software for the AI era \ Anthropic

Anthropicは、サイバーセキュリティ分野の新たな取り組み「Project Glasswing」を発表し、未公開の新モデル「Claude Mythos Preview」を公開しました。Claude Mythos Previewは汎用型のフロンティアモデルで、ソフトウェアの脆弱性発見や悪用手法の特定において、極めて高い能力を持つとされています。Anthropicによると、このモデルはすでに主要なすべてのOSやWebブラウザを含む重要ソフトウェア群から、数千件の高深刻度の脆弱性を見つけたといいます。

発表によれば、ここ数週間で特定した脆弱性の多くはゼロデイで、開発元にも把握されていなかった問題でした。例えば、OpenBSDで27年間見逃されていた脆弱性や、FFmpegで16年間残っていた欠陥、Linuxカーネル内で一般ユーザー権限から完全な制御権へ到達できる複数の脆弱性の連鎖などを発見したとしています。これらはすでに関係する保守担当者へ報告され、修正済みです。

ベンチマークでも、Claude Mythos Previewは既存モデルを大きく上回る結果を示しました。脆弱性再現ベンチマーク「CyberGym」では83.1%となり、Claude Opus 4.6の66.6%を上回りました。

出典:Project Glasswing: Securing critical software for the AI era \ Anthropic

ソフトウェア開発関連でも、SWE-bench Proは77.8%、Terminal-Bench 2.0は82.0%、SWE-bench Verifiedは93.9%を記録し、いずれもOpus 4.6を上回ったとしています。

出典:Project Glasswing: Securing critical software for the AI era \ Anthropic

さらに、推論性能を測る「GPQA Diamond」では94.6%、「Humanity’s Last Exam」ではツール使用時64.7%、ツールなしでも56.8%に達しました。

出典:Project Glasswing: Securing critical software for the AI era \ Anthropic

検索やコンピューター利用を含む評価でも、「BrowseComp」は86.9%、「OSWorld-Verified」は79.6%でした。

出典:Project Glasswing: Securing critical software for the AI era \ Anthropic

Anthropicは、こうした高いコーディング能力と推論能力が、強力なサイバー能力の基盤になっていると説明しています。

Anthropicは、Claude Mythos Previewの危険性の高さも強調しました。高度な脆弱性検出と悪用能力が広く拡散すれば、経済や公共安全、国家安全保障に深刻な影響を及ぼす可能性があるためです。このため、同社は現時点で一般公開を予定していません。

まずはAmazon Web Services、Apple、Cisco、Google、Microsoft、NVIDIA、Palo Alto Networksなどが参加するProject Glasswingの枠組みで、防御目的に限定して活用を進めます。加えて、重要なソフトウェア基盤を開発・保守する40超の追加組織にも提供し、自社システムやオープンソースソフトの安全性向上に役立てる方針です。

Anthropicは、この取り組みに最大1億ドルの利用クレジットを拠出するほか、オープンソースセキュリティ団体向けに計400万ドルを寄付するとしています。同社は90日以内に、修正済み脆弱性や改善内容を含む知見を公表する予定です。AIによる脆弱性発見能力が急速に高まる中、防御側が先に活用体制を整えられるかが、今後の重要な焦点になりそうです。


出典:Project Glasswing: Securing critical software for the AI era \ Anthropic

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次