パナソニックR&Dカンパニー オブ アメリカ(PRDCA)とパナソニック ホールディングス(パナソニックHD)は10月17日、カリフォルニア大学ロサンゼルス校(UCLA)の研究者らと共同で、AIによる画像生成における推論時に、AIが自らの生成結果を振り返って改善する画像生成技術「Reflect-Dit」を開発したことを発表した。

  • “自ら反省する”画像生成技術

    パナソニックHDなどが“自ら反省する”画像生成技術を発表(出所:パナソニックHD)

スケーラブルで高信頼性のAI開発を目指すパナソニックHD

さまざまな顧客に素早く届く“Scalable AI”と、顧客から求められる高い信頼性に応える“Responsible AI”という2つの軸で、データから実装まで一貫したAI開発プロセスの構築、そしてその高度化に取り組むパナソニックHD。同社はAI開発プロセスの中で、AIの性能を決定する重要な工程として“教師データの構築”と“アルゴリズム”を挙げ、その改善に日々取り組んでいる。

パナソニックHDとしてはこれまで、階層的な画像認識を実現するマルチモーダル基盤モデルの開発を2023年11月に発表したのを皮切りに、アノテーションの効率化を実現する技術や画像生成AIの確立、テキスト・画像・音の相互変換が可能なマルチモーダル生成AIの開発など、さまざまな取り組みを進めてきたとのこと。そして今般は、AIによる画像生成の改善プロセスを効率化するため、“生成した画像を自ら振り返るAI”の開発に着手したとする。

  • “自動改善サイクル”のイメージ

    パナソニックHDが開発を目指した“自動改善サイクル”のイメージ(出所:パナソニックHD)

AIによる画像生成の“自動改善ループ”を構築

近ごろ一気に普及が進んでいる画像生成AIは、テキストでの指示を大まかに反映した画像の生成が可能である一方で、指定した物体の個数や配置などを一発で正確に反映することは未だ困難だ。そのため要求に合う画像を生成するためには、とにかく大量の画像を生成し、その中から一番近いものを選びつつ徐々に改善していくという方策が一般的だった。しかしこの方法では2000枚近くの画像生成が必要となることもあるなど、膨大な計算量を要する点が課題視されていた。

そうした中でパナソニックHDが開発を目指したのは、AIが生成した画像について、その改善点をAIに自動でフィードバックする仕組みだ。今回開発された技術では、AIによる画像生成プロセスに、生成画像および改善点のペアを生成AIに入力するネットワーク(フィードバック処理部)が追加された。この処理部には、画像の良悪を判断する視覚言語モデル(VLM)と、フィードバック用テキストを生成するAIが組み込まれているとのこと。これらが生成画像に対するフィードバックを生成し、それを受けた画像生成AIが次の生成に活かすことで、自動改善ループが構築されたとする。

  • 生成画像の自動改善ループの概要

    生成画像の自動改善ループの概要(出所:パナソニックHD)

  • Reflect-Ditの構成概要

    Reflect-Ditの構成概要。フィードバック処理部の追加により自動改善のサイクルが実現された(出所:パナソニックHD)

なお開発に携わったPRDCAの加藤祐介氏によると、新開発技術を用いて画像生成を行った場合には、指定された物体の個数・属性・位置の観点で従来手法と比較すると、生成品質でいずれの項目でも高い性能を示すことが確認されたという。また同等性能で比較した場合には、既存手法では約20枚の画像生成が必要とされる性能を、新手法では4枚の生成で実現。生成効率を約5倍に高めることが証明されたとした。

  • 既存手法との生成効率の比較

    既存手法との生成効率を比較したグラフ(出所:パナソニックHD)

“イメージの可視化”を迅速かつ容易に

パナソニックHDは、今回の画像生成技術による貢献が期待される例として、“現場特化AIの開発プロセスにおけるデータ収集効率化”と“営業・提案業務の効率化”を挙げる。前者については、AI開発プロセスにおいて重要な教師データの生成を効率化することで、AI性能改善ループの短縮化に貢献できるとのこと。一方の後者については、空間デザインやレイアウトなど視覚化が有効な場面において、コミュニケーションの中で生まれたアイデアを正確に反映した画像を生成することで、イメージの共有を迅速化するという。

ただし現状の課題として、加藤氏は、画像の改善点に対する判断がVLMに依存しており、VLM自体の評価・修正を自動で行う仕組みがない点を挙げる。現行では必要に応じて人手でのプロンプト入力による修正が必要となるが、今後はVLMの学習強化による大規模化を通じてその精度をさらに向上させ、実用化に向けた強化を行っていくとしている。

なお今回の発表内容については、10月19日から23日まで米・ハワイ州で開催されるAI・コンピュータビジョンに関する国際カンファレンス「IEEE/CVF International Conference on Computer Vision(ICCV) 2025」に採択され、発表が行われる予定だ。