フランスのAIスタートアップであるMistral AIは12月9日、コーディングに特化したAIモデル「Devstral 2」をリリースした。1230億パラメータのDevstral 2と、240億パラメータの「Devstral Small 2」に加え、Devstralモデル向けのネイティブCLI(Command Line Interface)「Mistral Vibe」も公開した。

1230億パラメータのDevstral 2と軽量版のSmall 2をオープンソースで提供

Devstral 2はModified MIT License、Devstral Small 2はApache 2.0 Licenseのもとで提供。

Devstral 2は1230億パラメータ、25万600トークンのコンテキストウィンドウをサポート。SWE-bench Verifiedスコアは72.2%、オープンウェイトモデルの中でもトップクラスかつコスト効率に優れるという。

Devstral Small 2も同様に25万6000トークンのコンテキストを持ち、68.0%のスコアを記録。240億パラメータだが5倍以上の規模を誇るモデルと互角の性能を発揮し、一般的なPC環境でもローカル実行を可能としている。

他のオープンウェイトモデルと比較したSWE-bench Verifiedスコア

両モデルは、DeepSeek V3.2やKimi K2と比較して、Devstral 2は5分の1、Small 2は28分の1の規模となる。

Devstral 2はマルチファイルにまたがるコードベースを探索し、アーキテクチャレベルでの変更を維持しつつ、依存関係の追跡や失敗時の再試行処理を統合。バグ修正やレガシーシステムのモダナイゼーションにも対応し、特定言語や大規模エンタープライズコードベースへのファインチューニングも可能としている。

評価にはClineによる独立注釈者を起用し、DeepSeek V3.2やClaude Sonnet 4.5と比較。Devstral 2はDeepSeekに対して42.8%の勝率(28.6%の敗北率)を記録し、Claude Sonnet 4.5には完敗するものの、クローズドモデルとの差は縮まりつつあるとのこと。

、「DeepSeek V3.2」と「Claude Sonnet 4.5」とのモデル性能比較

一方、Mistral Vibe CLIはDevstralモデルを駆動するオープンソースのターミナル内コードエージェント。自然言語でコードベースの探索・編集・実行可能で、Agent Communication Protocol経由で好みのIDEにも統合できる。

主な機能として、プロジェクト認識コンテキストとしてファイル構造やGit状態を自動スキャンし、適切な背景情報を提供するほか、スマートリファレンスは「@」でファイル参照、「!」でシェルコマンド実行、「/」で構成変更などができる。

また、マルチファイル編成は編集中ファイルだけでなく全体の構造を把握し、アーキテクチャ的に一貫した対応を可能としている。そのほか、永続履歴、オートコンプリート、テーマのカスタマイズができることに加え、スクリプト呼び出し対応、ツール実行の自動承認切替、config.tomlによるモデルやプロバイダーの設定制御が可能。

Devstral 2は現状API経由で無料で利用でき、無料期間終了後はAPI利用料がDevstral 2で100万トークンあたり入力$0.40/出力$2.00、Devstral Small 2では入力$0.10/出力$0.30に設定している。

Devstral 2の展開にはGPU(NVIDIA H100クラス×4基以上)を推奨し、Devstral Small 2は単一GPU環境またはCPUでも動作可能で、市販GPUおよびNVIDIA NIMに対応を予定している。