米NVIDIAは現地時間3月18日、ヒューマノイド(人型)ロボット開発用のオープンな基盤モデル「NVIDIA Isaac GR00T N1」を発表。開発に必要なデータセットもあわせて提供する。
GR00T N1は、人型ロボットにスキルと推論を提供する、“世界初のオープンでフルカスタマイズ可能な基盤モデル”で、NVIDIAが事前トレーニングし、ロボット開発者向けにリリースするモデル群の第1弾と位置づけている。
最大の特徴は、人間の認知の原則に着想を得た、“思考の速い行動モデル”と“慎重で体系的な意思決定モデル”で構成する、デュアルシステムアーキテクチャを備えること。「システム1」は人間の反射神経や直感を反映した素早い思考の行動モデル、「システム2」は理路整然とした意思決定をするための“ゆっくり考える”モデルとしてつくられている。
システム2は視覚言語モデルを備え、環境と受け取った指示に基づいて推論し、行動を計画。そしてシステム1が、これらの計画を正確で連続的なロボット動作に変換する。なお後者は、人間のデモンストレーションデータとNVIDIA Omniverseプラットフォームによって生成された大量の合成データでトレーニングされている。
たとえば、ロボットの手でモノを掴んだり、片腕または両腕でモノを動かしたり、片腕から別の腕にモノを移動したりといった、一般的なタスクを容易に一般化でき、スキルの組み合わせを必要とする複数のステップを実行することも可能。これらの機能は、素材を取り扱う作業や、包装や検査といったさまざまなユースケースに適用できるとのこと。
また、開発者らは特定の人型ロボットやタスクのために、実データや合成データを使ってGR00T N1を事後トレーニングできるという。
なお、米国で開催されている「NVIDIA GTC 2025」の基調講演においては、GR00T N1で構築された事後トレーニングを受けた1X製人型ロボットが、家庭用の片付け作業を自律的に行う様子を実演している。