パナソニック ホールディングス(パナソニックHD)とFastLabelは9月27日、パナソニックHDがグループ全体におけるAI開発効率向上を目的に開発を進めるマルチモーダル基盤モデル「HIPIE(ヒピエ)」を、FastLabelの「Data-centric AIプラットフォーム」と統合し、自動アノテーションモデルとして構築するための協業を開始することを発表した。
これに際し両社はメディア向け発表会を開催。デモンストレーションなどを通じて、協業で目指すものやパナソニックHDとしてのAI開発戦略について説明した。
AI開発コストの約90%はアノテーションに集中
パナソニックグループは、“地球環境問題の解決”と“一人ひとりの生涯の健康・安全・快適”の実現を目指し、環境とくらしへと貢献する技術の開発に注力している。その中ではAIの活用も当然必要になるといい、パナソニックHDとしては、グループ全体として活用でき、リアル空間への適用が可能なAIの開発を進めている最中だという。
同社のAI開発戦略における2つの柱として、パナソニックHD 技術部門 テクノロジー本部 デジタル・AI技術センター 所長(発表当時)の九津見洋氏は、“Scalable”と“Responsible”を挙げる。前者については、家電や車載領域、電子部品、エネルギー領域など幅広い事業を展開するパナソニックグループにとって、各事業の現場ごとにデータ構築やチューニングを行う手間は大きな課題であるため、スケーラブルなモデルの開発を目指すとする。またリアルな空間を対象とした場面でも多くAIが求められることから、高い品質や信頼性の実現も重要だとしている。
FastLabel 代表取締役CEOの鈴木健史氏によると、今後5年から10年ほどで社会全体がAIへと依存しインフラの1つへと役割が増大すると予測される中、そのAI開発の現場では、かつてのアルゴリズム開発が重要視された時代から、その学習材料となる教師データが重視される“データセントリックなAI開発”へのシフトが進んでいるという。すでに開発が進むAIアルゴリズムについては既存の選択肢から適したものを選ぶようになる一方、AI開発における約90%もの工数が教師データ作成(アノテーション)に費やされているとのこと。その作業においては、現場の専門知識を持つ人材が自社の保有するデータを教師データへと変換する必要があるものの、知見を有する技術者単独ではアノテーションを行える環境が無い一方、AIエンジニアの不足により業務過多に陥るなど、アノテーション作業におけるイノベーションが進んでいない点が課題だとする。
このようにアノテーションに要する負担が大きい現在のAI開発プロセス。中先述したように幅広い事業を抱えるパナソニックグループでは、製品や現場それぞれに最適化されたデータセットの構築が必要となり、アノテーションおよびチューニングの工数増大がAI展開のボトルネックになるという。
マルチモーダル基盤モデル「HIPIE」をスケーラブルに
そんな中でアノテーションの効率化のためにパナソニックHDが開発したのが、画像AIと言語AIを融合させたマルチモーダル基盤モデルのHIPIEだ。同技術では、大規模言語モデル(LLM)の事前知識を活用することで、テキストプロンプトで指定した対象を画像から認識することが可能で、単語・文章の網羅性が高い言語AIの特徴量に近づけるように画像AIの特徴を学習するため、未学習の物体でもゼロショットで認識できるとする。この技術により、テキストベースで蓄積された知見などを学習させることでも画像AIの性能向上につなげられるといい、九津見氏は、HIPIEを活用することで1物体あたりのアノテーション時間を大きく削減し、「劇的にプロセスを改善することができる」と説明する。
そして今般、FastLabelが提供するData-centric AIプラットフォームとHIPIEを自動アノテーションモデルとして統合。直感的に利用できデータ管理も容易なプラットフォーム上とHIPIEを連携させることで、AIエンジニアでない作業者でもアノテーションを行えるようになるという。また、通常のAIモデルでは学習後の対象追加などで再学習が必要になるのに対し、アノテーション対象を任意に指定・変更して素早く現場へと適用することが可能になるとする。
なお今回の協業では、まずFastLabelのプラットフォームからHIPIEを自動アノテーションモデルとして実行できるようにしたうえで、パナソニックグループが保有するデータを用いたアノテーションのコスト削減効果を検証するとのこと。さらにそのデータを用いてHIPIEのファインチューニングを行い、各現場に特化したアノテーションモデルを作成することで、より高精度な自動アノテーションの実現を目指すとした。
会見内で行われたデモンストレーションでは、冷蔵庫(野菜室)の画像から物体認識を行う様子が披露された。手作業によるアノテーションでは、1種類の物体についてその輪郭をなぞり名前付けするまでおよそ1分を要した一方、新開発技術では「tomato」「banana」など名前を直接入力することで物体を認識。また自動で表示された認識範囲の輪郭は手作業で修正を加えられるため、1物体あたり約5秒までアノテーションが効率化されたとしている。
11月ごろからの段階的投入に向け開発を継続
パナソニックHDの九津見氏によると、今回の協業により生まれた新たなプラットフォームの活用開始時期について「今年の秋ごろ、11月あたりからの段階的な投入を検討している」とのこと。加えて今後は、パナソニックHDが開発を進めるLLM「Panasonic-LLM-100b」をマルチモーダル基盤モデルへと統合することで、さらなるAI開発効率向上を計画しているという。
また現時点で具体的な計画は無いものの、将来的には自動アノテーションモデルの外部提供についても積極的に検討していく見込みだといい、まずは社内の多岐にわたる事業領域の社内データとFastLabelが提供するプラットフォームとのシナジーにより、AI技術戦略の実現および幅広い領域でのAI開発加速を目指すとしている。