Google Cloudは3月7日、オンラインとオフラインのハイブリッドで「Generative AI Summit Tokyo '24」を開催した。本稿では「生成AIの実践展開へ:Google Cloudの最新進化と企業導入のための重要なポイント」と題した基調講演に加え、日本テレビ放送網における事例を紹介する。
Geminiの由来とは?
はじめに登壇したのは、Google Cloud 事業本部 執行役員 事業本部長の橋口剛氏だ。同氏は昨年末に発表したAI基盤モデル「Gemini」について以下のように説明した。
「Geminiは双子座を意味します。Geminiを開発した、Google DeepMindとGoogle Brainの2チームが取り組んだプロジェクトのため、双子=Geminiとしています。また、NASAの2人組の宇宙飛行士による有人宇宙飛行プロジェクト『Gemini』が後のアポロ計画につながる、チャレンジングなものだったことから、2つのチームが融合してチャレンジングな取り組みをすることが由来となっているのです」(橋口氏)
Geminiはネイティブにマルチモーダルであり、洗練された推論により、高精度なモデルかつ高度なコーディングを可能とし、Nano、Pro、Ultraの3つモデルで提供している。さまざまなユーザーがさまざまなユースケースで利用することができるという。ここで言うマルチモーダルとは、初期の段階から複数のデータ種類でトレーニングすることで、会話自体をコードや画像、動画、音声、テキスト間でシームレスに行うことができることを指す。
数年前まではGoogleがAI開発は世界的に先行していた。しかし、昨今ではOpenAIのChatGPTなどの後塵を拝してきたGoogleとっては秘密兵器とも言えるAIモデル、それがGeminiだ。
現在、Geminiの活用状況として橋口氏は「昨年までは“試す”でしたが、今年からは業務でいかに使い倒すにフェーズが変化しています」と述べており、小売、医療、金融サービス、メディア・ゲーム・エンターテイメント、製造、公共などのユースケースが散見されているという。
生成AIをアプリケーションとして捉える
続いて、登壇したのはGoogle Cloud 統括技術本部長(アナリティクス / ML、データベース)寳野雄太氏。同氏はファッション業界の例を引き合いに出し、生成AIの現状について「約半数は利用しているが、定期的に利用して業務に組み込んでいる割合は4%に過ぎないのです。『生成AIは賢いな』と捉えているだけでは活用は進みません」と指摘。
生成AIはモデルが学習した時点のデータをもとに、最もらしい文章を回答するためハルシネーション(幻覚)が発生することがある。
そのため、生成AI自体を「アプリケーション」として捉える必要があるという。こうしたことから、外部のデータソースを参照しながら、事実にもとづいて回答する「グラウンディング」と呼ぶ技術を用いて、検索結果から根拠付けを行うことでハルシネーションを軽減させることができる。
AIモデル、グラウンディングのほかに、タスクに特化させる「チューニング」、アプリに動作させる「拡張」、「検索」、「会話」といったさまざまな要素を組み合わせることで、生成AIは実用化に向かうとの見立てだ。
「コンテンツ制作にAIを導入する」と打ち出した日テレ
次に、日本テレビ放送網 DX推進局 データ戦略部 担当副部長の川越五郎氏が登壇し、同社における事例を解説した。同社では2022年に「コンテンツ制作にAIを導入する」と打ち出した。
川越氏は「当時のAI活用をレベル0~5まで定義し、レベル5はデータやAIでコンテンツが生成されるとし、想定時期は2023年にしていました。しかし、当時はAIでヒット作ができるわけがないなどと鼻で笑われていました。もちろん、権利や倫理に関する課題が山積していることも認識しており、マスメディアとして情報の公平性や正確さ、信頼性に加え、安心・安全な発信が必要なため会社としてできないかもしれませんでした」と話す。
また、同氏は「生成AIは組織変革の機会である」とも語っており、チャットボットで生産性を向上させることはゴールではなく、「ITエンジニアのカルチャー」「ノウハウやナレッジの蓄積」「リテラシー」の3つを、その先の目標とした。
ITエンジニアのカルチャーについて、同社ではIT企業のように豊富なエンジニアを抱えているわけではないが、キャリア採用や若手エンジニアなどが集まりつつある状況ではあることから、組織・マインドのアジャイル化、エンジニア育成、内製化に取り組んでおり、Googleのカルチャーを参考にしているという。
公募型プロジェクトとして、15人以上のエンジニアで進め、社員主体のチームで開発に取り組み、内製化を目指す企業や組織に向けたGoogle Cloudのプログラム「Tech Acceleration Program(TAP)」を活用している。
ノウハウやナレッジの蓄積に関しては、同社のデータ基盤はアナリティクスプラットフォームの「BigQuery」で管理しており、KPIやKGIなど定量的なものが管理されている。一方、生成AIの活用ではナレッジやノウハウといった定性的なデータも必要になるため、利用部門の業務改善とともにデータが貯まる仕組みを構築し、AIにも使えるように取り組んでいる。
リテラシーでは、AIを利活用・推進するだけでなく、課題やリスクを理解し、エンジニア自身がAI活用の敷居を下げることも求められてくると想定しており、社内勉強会やコミュニティの活性化が必要とのこと。勉強会には150人以上が参加し、35人以上、14部門からヒアリングして、要望を取りまとめている。コミュニティは45人、認定AIガイドラインを策定している。
日テレでは生成AIで何を進めているのか?
川越氏は「データ、可視化、Webアプリケーション、生成AIそれぞれが連携しながら、新しい働き方、価値を創造するというビジョンのもと、生成AIの活用を進めている」と述べた。
こうした取り組みの第1弾として開発したものがチャットボット「Mate 1.0」だ。これは社内アプリケーションとしてのチャット機能を持ち、Gemini対応のAPIで機能連携し、プロンプト評価・検証環境などで構成。
エンタープライズデータの検索機能「Vertex AI Search」、LLM(大規模言語モデル)の「PaLM 2」、BigQueryなどの技術が活用されており、今後は非構造化データに強いGeminiの搭載を検討している。
同社ではMateの活用により、次世代の働き方を実現するため、(1)企画では要約、壁打ち/ネタ出し、アイデア生成、企画書、(2)放送/配信では原稿校閲、有事マニュアル検索、動画の尾辺jクト抽出、(3)アーカイブ/分析は対話型の視聴率分析、番組の傾向分析、動画シーン検索などを担う。
また、(4)編成/製作では製作フローの自動化、各種申請の適正化、原稿チェック、画像/映像生成、(5)視聴者センターは問い合わせ内容の分類、番組品質の向上、問合せ対応などを想定している。
そして、最後に同氏は「生成AIを何かの機会であること考えることが必要です。われわれは組織変革として位置づけています。また、エンジニアが少ない環境で進めなければなりせんが、Google Cloudは生成AIをオールインワンで使える環境が用意されているほか、自社のエンジニアの育成にもつながります。さらに、データとAIは密接な関係であることから、どこにデータを集約して蓄積するのかは生成AIの活用ではカギになります。加えて、組織において、どのようにして生成AIの理解を深め、巻き込むかは重要なポイントになります」と結んだ。