生成AIがサイバー空間を飛び出し、現実世界で動き始めている。デンソーが描く「フィジカルAI」は、ロボットや機械を通じて人間と協働し、新たな顧客価値・社会価値を生み出す取り組みだ。接客や製造の現場で進む実証から見えてきたのは、単なる効率化ではなく、価値創造にこそ生成AIを使うべきだという明確な方向性だった。
3月11日に開催された「TECH+セミナー スマートマニュファクチャリング 2026 Mar. 未来を創る人材と組織~変革を支える環境と実践~」に、同社 研究開発センター シニアアドバイザーの成迫剛志氏が登壇。同社の設計しているフィジカルAIのアーキテクチャについて説明した。
このままではクラウドの二の舞、生成AIを価値創造にどう生かすか
講演冒頭で成迫氏は、「汎用技術(General Purpose Technology)」について説明した。汎用技術とは単一の分野にとどまらず経済や社会全体、人間の生活全体に対して広範囲に持続的な影響を与える基幹的な技術のことを指す。古くは紀元前の農耕や動物の家畜化、鉄、中世から近代の印刷や蒸気機関、電気、20世紀のコンピューターや21世紀のナノテクノロジーまで、総務省のサイトによれば24の技術が汎用技術とされている。
20世紀に登場したインターネットもその一つであり、現在の私たちの社会・生活はインターネットを前提として成り立っている。以前は電車の中では新聞を読み、調べものは図書館に行き、旅行では紙の地図を広げていたが、これらは全てパソコンやスマートフォンで行うことになり、音楽を聴くのもCDではなく配信サービスが主流となった。
生活の全てを大きく変えたインターネットだが、インターネットそのものをつくっていた人や企業は、今の世界の時価総額ランキングの上位にはいない。上位を占めるのはインターネット上で新しい世界を生み出してきた企業なのだ。
一方クラウドについて見てみると、主要プレイヤーはアメリカや中国で、日本のIT関係企業は少ない。成迫氏はその理由について、日本では物理サーバを減らしてコストを削減し効率化することを主眼に、クラウドの基本技術である仮想化技術を磨いたためだと説明する。つまり、技術そのものをつくったり、クラウドによって効率化したりするよりも、クラウドによって新しい価値を生み出す取り組みをした企業が変革をもたらしたと考えられるのだ。
効率化と価値創造とでは、効果の出るタイミングも違う。新たに登場したテクノロジーを効率化やコスト削減に活用するとビジネス貢献度は急速に上昇する。しかしビジネス貢献度は相対的なものであるため、広く普及すればすぐに低下する。その一方で、新たなテクノロジーを顧客や社会の価値創出に活用すると、効果が出るまで時間はかかるが、その後貢献度は指数関数的に上昇し続ける。
同氏が示したデータによると、2024年末の日本のCIOやCDOを対象としたアンケートで大半の回答者は、この20年でインパクトが大きかったテクノロジーはインターネットと生成AIだと答えた。しかし同年の別の調査では、アメリカ企業では生成AIは顧客満足度、顧客価値創造に活用されているが、日本企業では工数削減、コスト削減のための活用が多いことが分かったという。
「生成AIのインパクトに気付いているのに、価値創造に重点を置いていない。このままではクラウドの二の舞になってしまいます」(成迫氏)
生成AIをリアル世界で動かす「フィジカルAI」とは何か
生成AIの現在の主流であるLLM(Large Language Model、大規模言語モデル)を基盤とするため、言葉を操るのがうまく、プログラミング言語も得意だ。そして今はすでにマルチモーダルの段階に来ており、画像や音声、動画など、リアルな世界のあらゆる情報を取り入れて基盤をつくる時代となった。
例えば自動車から撮影した一枚の写真を生成AIに見せれば、それが何も学習をしていない生成AIであっても状況を判断して交通上の注意点を指摘してくれる。夜の森からシカが飛び出してくる写真なら、群れで行動するというシカの習性まで考慮して、次々に出てくる可能性にも言及する。動画や音楽をつくるのも簡単だ。そして驚くべきは、こういったことが手元のスマートフォンでできてしまうことである。
「まだ精度が粗いものもありますが、技術はあっという間に進化します。生成AIがさまざまな領域で社会実装され、汎用技術にリストアップされる日も近いでしょう」(成迫氏)
これらのことはまだその多くがパソコンやスマートフォンの“向こう側”、つまりサイバー空間上にあるが、それをリアルの世界に持ってこようというのが「エンボディドAI(Embodied AI)」という考え方だ。これは身体性を持つ物理AIをリアルな世界で活用しようという考えで、「フィジカルAI」とも呼ばれる。そういうとヒューマノイドをイメージしがちだが、あくまでサイバー空間の生成AIをリアル世界に持ってくるのが正しいフィジカルAIの理解であると成迫氏は指摘する。ヒューマノイドに限定して考えると未来の適用の幅を狭めることになるためだ。
生成AIがロボットを動かす、デンソーのフィジカルAIアーキテクチャ
デンソーの成迫氏のチームはこうした考えに基づき、フィジカルAIのアーキテクチャを設計している。目の前の課題を解決するだけでなく、生成AIやフィジカルAIという汎用技術の上で新たな世界、新たな価値を創出することを重視。人とロボットが一緒に働き、生活の場にもロボットが入り、生成AIを使って自律的に動く機械があらゆる場所にあるという世界を目指している。
同チームが考えるフィジカルAIの仕組みはこうだ。まず、人間のあいまいな指示を生成AIお得意の言語力で明確化する。サイバー空間とは異なるため、物理的な制約を考慮して判断できるように、ロボットの役割や能力、パーソナリティはあらかじめ定義しておく。生成AIは必要に応じてインターネットやRAG(Retrieval-Augmented Generation、検索拡張生成)も参照し、自分のできること、すべきことを判断する。そしてあらかじめ用意しておいて、掴む、動かす、見るなど物理的作業を細切れにしたプログラムを組み合わせて、すべきことに対してロボットを動かすプログラムをその場で動的に生成してロボットに作業させる。さらに、この設計は他社製も含めたロボットやさまざまな機械など全てのものを同様の仕組みで動かせるものだ。
名古屋駅で実証 フィジカルAIはどこまでできるのか
このアーキテクチャを使って行っているのは、定性的な仮説探索・仮説発見だ。誰も見たことがなく市場もないところで新たな価値を創造しようとしているため、「実際にフィールドに出て仮説を探索している」と成迫氏は話す。
接客ロボットによる販売支援の実験
例えば、名古屋駅前にある名産品の販売店で、顧客と対話して商品を紹介するロボットの導入実験を行った。名古屋のシンボルの1つであるシャチホコの話題から話を広げてシャチホコモチーフの菓子を薦めるなど、他愛のない会話やあいまいな指示から生成AIが顧客の要望を読み取ることができたといい、導入後はロボットが推奨した商品の売上が伸びたという。
コーヒー生成と“混ぜる”応用
オリジナルコーヒーをブレンドしてくれるロボットの実験も行われた。顧客との対話からその人の要望に最適な配合をその場でつくってくれるというものだ。コーヒー豆自体のデータは学習しているものの、配合はその場で生成AIが決める。「目が覚めるようなコーヒー」といったあいまいな指示でも適切な配合ができたことから“混ぜ物”が得意だと判断し、カクテルをつくるという新たな実験につながったそうだ。
異種ロボットの協調と人との協働
同氏は3台のロボットがそれぞれ日本語でコミュニケーションをしながら作業を行う動画も披露した。3台のロボットはそれぞれ異なる会社の製品だが、あらかじめ学習したデータに基づく発言や行動をしているのではなく、それぞれがその場で判断し、会話・行動をする。ここに人間が加わることも可能だ。ロボットとの会話で人間がすべきことが分かるため、例えばその作業の未経験者でもロボットと共同で効率よく作業することができる。
工場への応用と柔軟な生産体制
工場では、ロボットでトヨタ生産方式の多能工によるフレキシブル生産を再現することに取り組んでいる。例えば3台のロボットが1つのモーターを共同で組み立てる場合、作業割り当ては決めておかず、どのロボットがどの作業をするのが適切かをその場で生成AIが考えて決める。万一1台が壊れても残り2台で作業を継続でき、人間が参加しても人間とロボットが日本語で会話しながら作業を続けられるようにした。さらに異常検出やリカバリーなど、従来の機械では難しかった柔軟な対応も生成AIによって可能とする取り組みも行っている。
フィジカルAIが目指す新たな価値創出
これらは全て、汎用技術になっていくかもしれないフィジカルAIというテクノロジーの上で、新しい価値、新しい世界を創造するための取り組みだと成迫氏は話した。
「これらの取り組みは、今はそれぞれが独立しているように見えますが、最終的に目指す新たな世界が見えてくるところまで来ています。効率化、合理化ももちろん大事ですが、ぜひ皆さんも生成AIによって新たな価値を創出する取り組みを行ってください」(成迫氏)
