Cursor、AIコーディングモデル「Composer 2.5」をリリース

出典:Composer 2.5 の紹介 · Cursor

Cursorは2026年5月18日、AIコーディング支援モデルの新バージョン「Composer 2.5」をリリースしました。Composer 2.5は、前モデルのComposer 2と比べて知能とふるまいが大きく向上したとされ、長時間にわたるタスクで持続的に作業する能力や、複雑な指示への追従性が改善されました。Cursorは、ユーザーとの協働もよりスムーズになったと説明しています。

Composer 2.5は、Composer 2と同じくMoonshotのオープンソースチェックポイント「Kimi K2.5」を基盤としています。学習では、より難しいタスクを扱う強化学習環境を生成し、新しい学習手法も導入しました。既存のベンチマークでは捉えにくいコミュニケーションスタイルや、タスクにどの程度の労力をかけるかといった実運用上のふるまいも改善したということです。SWE-Bench Multilingualのようなベンチマークでは、GPT-5.5を上回る数値も示されています。

今回の学習では、テキストフィードバックを用いたターゲット型RLが取り入れられました。強化学習では、ロールアウトが数十万トークンに及ぶ場合があり、最終的な報酬だけでは、誤ったツール呼び出しや説明の不明瞭さなど、局所的な問題を特定しにくい課題があります。Cursorは、改善すべき箇所に短いヒントを挿入し、その結果得られるモデル分布を教師として使うことで、広い強化学習の目的を保ちながら、特定のふるまいを狙って修正できるようにしたとしています。

合成データの規模も拡大されました。Composer 2.5は、Composer 2の25倍の合成タスクで学習されています。実際のコードベースをもとに、特定の機能を削除し、それを再実装させるようなタスクを生成することで、テストを検証可能な報酬として利用しました。一方で、モデルがPythonの型チェック用キャッシュやJavaバイトコードを手がかりに想定外の回避策を見つける例もあり、大規模な強化学習では慎重な監視が必要になることも示されています。

学習基盤では、Sharded Muonやdual mesh HSDPといった手法も使われています。1Tモデルではoptimizer step timeが0.2秒とされ、MoEモデルのexpert重みとnon-expert重みに異なるHSDP layoutを使うことで、通信負荷を抑えながら計算を分散できると説明されています。

価格は、通常版が入力100万トークンあたり0.50ドル、出力100万トークンあたり2.50ドルです。同等の知能でより高速なバリアントも用意され、入力100万トークンあたり3.00ドル、出力100万トークンあたり15.00ドルとなります。高速版はComposer 2と同様にデフォルトで提供されます。また、Composer 2.5では初週の使用量が2倍になるということです。


出典:Composer 2.5 の紹介 · Cursor

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次