自動車業界は岐路に立たされています。コンピュータ搭載車両はすでに実用化されているものの、その先の開発が追いつかず、基盤となるインフォテインメントアーキテクチャの設計が、大規模な推論やマルチモーダル認知、エージェントAIに適合していない車両が少なくありません。一方で、運転中や乗車中を除いたあらゆる場面で高度な生成AIを体験しているデジタル時代の消費者からは、車載インテリジェンスへの期待が急速に高まっています。
車載コンピューティングの現状と、車両に対するユーザーの期待には大きなギャップが生じている現在、車載AI Boxというコンセプトが勢いを増しているのには、大きな理由があります。
AI Boxは、OEMに車載エレクトロニクスの再設計やインフォテインメントSoCの置き換えを迫ることはありません。既存の車載インフォテインメント(IVI)に専用GPUで加速させたAIコンピューティングを追加することで、コックピットの安定を損ねたり認証サイクルの反復を強いたりすることなく、AI機能を向上させます。
従来型のIVIアーキテクチャが限界に近づいている理由
ほとんどの量産型IVIシステムは、UIレンダリング、オーディオパイプライン、ナビゲーション、メディア再生などの決定論的ワークロード向けに最適化されていました。グラフィックス機能の向上やAndroidエコシステムの拡大にもかかわらず、最新のインフォテインメントSoCでさえ、継続的な推論型AIシステムに合わせて設計されていたわけではありません。
車載エージェントAIは、プライバシー、安全性、分離についてのあらゆる制約を考慮しつつ、ローカルでのLLM/SLM/VLM実行、継続的なマルチモーダルインプット(音声、カメラ、テレメトリー、コンテキスト)、マルチステップの推論、雑多なコックピット作業負荷の下での遅延予測などを要求します。1つのSoC上でディスプレイとオーディオを稼働させつつこれらの作業を進めれば、ユーザーの満足度と検証にリスクが生じる可能性が出てきます。特に、車両ライフサイクルが月単位ではなく年単位で測られる場合はなおさらです。
AI Box:エージェント型車載AIへのモジュール式パス
AI Boxは、AIによる推論をインフォテインメントの実行から切り離すことで、この問題に対処しようとしています。OEMは、IVIを交換するのではなく、通常はイーサネット接続でコックピットコンピュータとトークンを交換する(さらに、多くの場合、カメラやセンサーのデータも交換する)専用のAI電子制御ユニット(ECU)を追加するのです。AI Boxは大規模なSLM/LLM/VLM推論を実行し、コックピットが提供する構造化されたアウトプット(計画、ツールコール、サマリー、UIプロンプト)を返します。
こうしたモジュール式パターンは、GPUで強化したCPU、NPUで強化したビジョンパイプライン、ドメインコントローラで強化した集中型ECUなどの車載システムではすでに馴染みがあります。何が新しいのかというと、それをエージェント型、対話型および推論型の車載AIに適用しているということです。
Cerence AIのパートナーであるNVIDIAのDRIVE AGXを基盤としたAI Boxは、その一例です。インフォテインメントSoCと連携する外付けAI基盤として、AI機能を独立して進化させるアーキテクチャが採用されています。また、NVIDIAとMediaTekによる統合の進展により、このような構成上で対話型AIや軽量モデルを実装する動きも現実的な選択肢となりつつあります。
AI Boxアプローチのメリット
1. プラットフォームの安定性を維持しつつイノベーションを加速
IVIスタックの安定性を保つことで、OEMは認証の反復リスクとUIの劣化を低減しつつ、AIイテレーションを加速させることができます。AIのサイクル(月単位)と車載プラットフォームのライフサイクル(年単位)が一致していないことから、この分離は大きな意味を持つのです。
2. 「デモAI」ではないリアルなAIパフォーマンス
専用のAIコンピューティングは、特に一貫した対話型の応答性が必要な場合に、グラフィックおよびマルチメディアとリソースを共有するインフォテインメントSoCよりも予測がしやすいスループットとワークロード分離を実現します。また、接続性が制限されているときにも、質の高いローカルな推論を実現する手段になります。
3. 独立したAIアップグレードサイクル
コックピットUIの安定性を損なうことなく、モデルやエージェントのスキルをアップデートします。
4. ハイブリッド型クラウドインテリジェンスによるエッジ優先のプライバシー
低遅延とプライバシーに関わる重要なタスクの実行を継続しつつ、接続性に応じて、ウェブを多用するタスクをクラウドエージェントに委託します。
AI Box戦略の成否を決めるもの
コンピューティングが優れていてもユーザビリティが良いとは限りません。音声がノイズでかき消されたり、インタラクションが不安定になったり、アシスタントがブランドの円滑な連携や強固なフォールバックを提供できなかったりすれば、開発の中断を余儀なくされることも珍しくありません。実際にアシスタントの信頼性を決めるのは、音声のフロントエンドとオーケストレーションです。自動車向けに強化された車内体験レイヤーがなければ、どんなに強力なAIハードウェアであっても期待外れとなる可能性があります。
AI Boxに“価値”を持たせるために重要な対話レイヤー
OEMがAI Box戦略を量産につなげるには、レジリエントなプロダクショングレードの対話レイヤーが必要です。Cerence AIのハイブリッドエージェント型AIプラットフォームであるCerence xUIは、AI Box内で、最適化されたSLMを利用してエージェント体験レイヤーを提供するよう設計されています。
AI Boxアーキテクチャの重要性と未来
エッジAI、マルチモーダルの車載インテリジェンス、エージェント型システムの勢いが加速を増しています。差別化できるかどうかは、スクリーンだけでなく、車両がいかに知的に、いかに安定的に、また遅延やプライバシー、接続性といった制約の下で、ドライバーや同乗者とのインタラクションを実現できるかにかかっています。AI Boxでは、「この車はAIを操作できるのか?」から「この車はいかに速やかにスマートになれるのか?」と、課題を新たな枠組みで捉え直すようになっているのです。
コックピットの未来は、エッジとクラウドを含めた全体的なモジュール式アクセラレーションとオーケストレーションによって形成されるでしょう。そうしたなか、AI Boxアーキテクチャは、車内の対話体験を統合するAIプラットフォームと組み合わせることで、OEMに、今こそ有意義な車載AIを提供するためのスケーラブルな道筋を示すことができるのです。
本記事はCerence AIの技術ブログ「The AI Box Moment in Automotive: Turning Compute into an Agentic In Cabin Experience」を翻訳・改編したものとなります