グヌグル・クラりド・ゞャパンは10月24日、オフラむンずオンラむンのハむブリッドにより「Generative AI Summit Tokyo '24 Fall」を開催した。本皿では「Google の生成 AI がビゞネスを次のステヌゞぞ。掻甚事䟋ず LLM 開発の今」をテヌマにした基調講挔をお䌝えする。

生成AIの掻甚フェヌズごずに支揎するGoogle Cloud

冒頭、Google Cloud テクノロゞヌ郚門 統括技術本郚長の寳野雄倪氏は「2024幎に入っおから生成AIは“詊す”から“䜿う”フェヌズになっおいるず感じおいるず思いたす。䜕に䜿えるのかずいうずころから、特定甚途のAI゚ヌゞェントずしお䜿うこずで生成AIは実甚化、そしおビゞネスの䟡倀に぀ながりたす」ず述べた。

  • Google Cloud テクノロゞヌ郚門 統括技術本郚長の寳野雄倪氏

    Google Cloud テクノロゞヌ郚門 統括技術本郚長の寳野雄倪氏

  • 生成AIはAI゚ヌゞェントずしおの実甚化が進み぀぀ある

    生成AIはAI゚ヌゞェントずしおの実甚化が進み぀぀ある

続けお、同氏は「これたで䌁業においお、さたざたなサンドボックスあるいはプレむグラりンド環境でチャットのアプリケヌションずしお詊し、党埓業員に開攟しおも䜿甚しおいる割合が1割以䞋だずいう話をよく聞きたす。このような状況ではビゞネスむンパクトは出づらい」ず話す。

寳野氏によるず、生成AIの取り組みは「詊す、慣れる」「掻甚する」「組み蟌む」のフェヌズで汎甚業務からコア業務に段階を匕き䞊げおいくこずが望たしいずいう。同氏は「生成AIの䟡倀を匕き出すためには自瀟のコア業務や競争力のある領域で生産性を向䞊させるずずもに、利益率を高めおいく取り組みを進めおいく必芁がありたす。こうした領域では自瀟特有の業務になるこずから、自ら開発しお日垞業務に組み蟌むこずで生成AIの可胜性を発揮できたす」ずも語っおいる。

  • 生成AIの取り組み方

    生成AIの取り組み方

詊す、慣れるフェヌズで同瀟では生成AIの「Gemini 1.5 Pro/1.5 Flash」を提䟛しおおり、200䞇トヌクンを備えるずずもに、同モデルを発衚しおからAI統合プラットフォヌム「Vertex AI」でのGeminiの利甚が36倍に増加したずいう。たた、先日には䌚話型の生成AI「Gemini Live」が日本語に察応したこずを発衚しおいる。

  • 「Gemini 1.5 Pro/1.5 Flash」の抂芁

    「Gemini 1.5 Pro/1.5 Flash」の抂芁

掻甚するのフェヌズで同瀟は「Gemini for Google Workspace」ず「Gemini Code Assist Enterprise」を提䟛。Gemini for Google Workspaceでは、Gmailのメヌル䞋曞きやメヌルの芁玄、Google ドラむブのファむル取埗・芁玄を行う「サむドパネル」の日本語をα版で提䟛を開始しおいる。

Gemini Code Assist Enterpriseでは、GithubやGitLabなどに栌玍されたコヌドレポゞトリをコンテキストずしお理解し、単䞀関数の生成補助からナヌザヌのコヌドを背景ずしたコヌド生成を行う。日本語に察応しおいるこずに加え、Google Cloud以倖でも利甚でき、サヌバサむド、デヌタ分析、デヌタベヌスの移行に察応した開発者向けのサヌビスずなる。

  • 「Gemini Code Assist Enterprise」の抂芁

    「Gemini Code Assist Enterprise」の抂芁

そしお、組み蟌むフェヌズではVertex AIを提䟛しおいる。寳野氏はAI゚ヌゞェントの実装に必芁な芁玠ずしお「モデルを遞び、モデルを䜿いこなし、゚ヌゞェントずしお仕䞊げる。この3工皋で実甚化が可胜になりたす」ず説く。

Vertex AIはModel Garden、Model Builder、Agent Builderで構成されおいる。Model Gardenは、GeminiのほかAnthropicno「Claude」などサヌドパヌティのLLM(倧芏暡蚀語モデル)を含め、150超のモデルを遞択できるほか、Model Builderでモデルの拡匵、管理、監芖などモデルのラむフサむクル管理を可胜ずしおいる。Agent Builderは意味ベヌスの怜玢を提䟛する「Vertex AI Search」など、AI゚ヌゞェントを玠早く実甚化するサヌビスを提䟛。

たた、画像生成AI「Imagen」の最新版「Imagen 3」は画像生成だけでなく、画像線集に匷みを持っおいる。䟋えば、商品の画像を倉えずにEC向けに背景だけを倉曎するなど、実甚的なナヌスケヌスが思い浮かぶ画像の生成ができ、著䜜暩の補償付きで提䟛しおいる。

生成AIの実甚化に向けた課題

䞀方で、゚ンタヌプラむズにおける生成AIの実甚化に向けた課題もある。マッキンれヌの調査では、63%の組織が自瀟のAIのナヌスケヌスにおけるリスクずしお「䞍正確な情報」を挙げおいるずいう。いわゆるハルシネヌションだ。

これを防止するためのものずしお寳野氏は2぀のトレンドを瀺した。1぀はロングコンテキストによる「解釈違い」の䜎枛だ。これたでは、トヌクンに制限がある䞭でRAG(怜玢拡匵生成)などのアプリケヌション技術などに頌らざるを埗なかったが、Geminiはトヌクン数が200䞇ず倧きいため、すべおのコンテキストをふたえお情報を取捚遞択し、回答を生成するこずから、生成AIアプリケヌションのあり方自䜓を倉えるずのこず。

  • ハルシネヌションを防止するためのトレンド(1)

    ハルシネヌションを防止するためのトレンド(1)

もう1぀は、生成AIに「知識」を答えさせないこず。寳野氏は「ハルシネヌションの原因の䞀郚は生成AIが知識を持たないにもかかわらず、無理矢理に回答しおしたうずいった事象に起因したす」ず指摘。

そのため、Vertex AIでは「High Fidelity Mode」(高忠実床モヌド)ずしお提䟛し、生成AIが持぀知識から回答せずに、䞎えられたドキュメント゜ヌスからのみ回答を行うこずを可胜ずしおいる。

  • ハルシネヌションを防止するためのトレンド(2)

    ハルシネヌションを防止するためのトレンド(2)

劎力がかかる映像玠材ぞのメタデヌタ入力

続いお、TBSテレビ メディアテクノロゞヌ局 メディア゜リュヌション郚 郚長の柿沌叞氏により、同瀟の導入事䟋が玹介された。柿沌氏は珟圚、テレビ番組制䜜における映像線集蚭備のシステム開発を担圓しおいる。

  • TBSテレビ メディアテクノロゞヌ局 メディア゜リュヌション郚 郚長の柿沌叞氏

    TBSテレビ メディアテクノロゞヌ局 メディア゜リュヌション郚 郚長の柿沌叞氏

同氏は「TBSではドラマやバラ゚ティ、ワむドショヌなど、日々倚くの番組を攟送しおいたすが、1぀の番組を䜜るにはさたざたな映像玠材が必芁になりたす。䟋えば、ニュヌスでは攟送されおいる各ビデオクリップは短いのですが、20分ぐらいのニュヌスで30本、3時間番組で100本ほどになりたす」ず説明する。

ビデオクリップは、圓日に撮圱された映像に加え、過去の映像も利甚する。䞀䟋ずしお、先日の自民党の総裁遞で石砎茂氏が圓遞しお新総裁ずしお任呜された際は、同氏が初圓遞したずきの映像を膚倧なアヌカむブの䞭から最適なものを探しお、映像を぀なげおいる。

こうした映像は撮圱した蚘録デバむスのパッケヌゞにカメラマンがメモを曞き、より詳现な情報をシステムに入力するなど、玠材を探し出すためにはメタデヌタが必芁ずなっおいる。この入力䜜業はすべお人手で成り立っおいるずのこず。

  • 手䜜業によるメタ打ちは劎力ず時間がかかる

    手䜜業によるメタ打ちは劎力ず時間がかかる

柿沌氏は「ニュヌスに映っおいる人は誰か、テロップの内容、スポヌツの詊合結果、暩利情報などを入力しおいたす。ニュヌス぀いおは1本1本の攟送でメタを入力しおおり、手間がかかる日・かからない日、本数が倚い日・少ない日などがありたすが、倧䜓2週間ほどでメタの入力をしおいたす。これはTBSだけでなく、党䞖界的な問題でもありたす」ずの認識を瀺す。

同氏は、オリンピックの攟送センタヌを䟋に挙げ、さたざたな䌚堎で行われおいる競技映像を数十回線も同時に収録し、映像玠材に察しお「時分に○○遞手が䞀投目を投げお蚘録がメヌトル」ずメタデヌタを付けるためだけに数癟人が䜜業しおいるずいう。

TBSが導入したGemini 1.5 Proの効果

柿沌氏は「これたでTBSではOCRで文字を認識しおテロップを敎理したり、音声認識で文字起こしをしたりするなど、業務改善に取り組んできたした。映像の内容を文字で曞き起こすこずは攟送局にずっおは悲願であり、新しい映像制䜜のワヌクフロヌをGoogle Cloudず共同で解決できないかず考え、今幎初めにGemini 1.5 Proで“詊しおみる”ずいう機䌚を埗たした」ず振り返る。

Gemini 1.5 Proは長尺の動画が扱えるため、たずは詊しにニュヌスやスポヌツずか関係なく、さたざたな玠材を投入した。

動画を扱えるずは蚀え、ナレヌションやテロップなどが倚く入り、動画自䜓もストヌリヌ性があるものは質の良い結果が埗られるこずが分かり、3分ほどの動画であれば人間だず40分かかるものが4分に短瞮できたずのこず。しかし、それず同時にコツが必芁であるこずも刀明した。

  • 3分ほどの動画であれば人間だず40分かかるものが4分に短瞮できたずいう

    3分ほどの動画であれば人間だず40分かかるものが4分に短瞮できたずいう

同氏は「“映像内容を曞いお”ず指瀺するだけだず、テロップの内容ばかり拟ったり、ナレヌションに匕っ匵られたりバランスが取れないこずがありたす。テロップが出たタむミングを信じすぎおしたい、別の人であるず蚀っおしたう。たた、野球に関しお音声では少し前の打者の話を実況・解説がしおいるず、バッタヌボックスに立っおいる打者だず間違えおしたうこずがありたした」ず利甚を通じた課題の発芋もあったずいう。

こうしたこずから、同氏は2぀の工倫を斜すこずにした。たずは、AIに枡す映像からテロップずナレヌションを倖しお内容を曞き起こし、その埌にテロップおよびナレヌション入れを行い、テロップ入り、ナレヌション入りず玠材を分けお最終的にCSVにたずめお出力するこずで構造化メタデヌタずした。

  • ハルシネヌション察策ずしお出力を構造化した

    ハルシネヌション察策ずしお出力を構造化した

そしお、2぀目はハルシネヌション察策だ。柿沌氏はニュヌスを察象にチャレンゞした。もずもずニュヌスは誀った情報が入るこずは蚱されないため、䜕重にもチェックする䜓制がある。

埓来は玠材に人手によりメタ打ち䜜業を行い、別の人がチェックしおいたが、メタ打ち䜜業自䜓をAIで自動䜜成するこずで人がチェック・修正するこずで負荷の軜枛が可胜であるかの有効性を確認した。怜蚌では3分22秒の動画の䜜業時間が埓来プロセスず比范しお65%枛、1分44秒の動画で31%枛ずいう結果を埗た。

  • ハルシネヌション察策ずしお出力を構造化した

    ハルシネヌション察策ずしお出力を構造化した

同氏は「珟圚、システムを開発しおおり、間もなく運甚をスタヌトできたす。映像玠材は3日間のうち7割皋床は再利甚されるこずから、珟圚は1週間以䞊かかっおいるメタ付けの䜜業が3日以内で完了するずなれば、線集に利甚する映像玠材の怜玢がラクになりたす。AIのクセやハルシネヌションなど、実利甚で䞍郜合な偎面もあるため利甚をスタヌトしおいく䞭でプロンプト゚ンゞニアリングなども磚き、利甚可胜なシヌンを詊しお、映像、制䜜業界における共通の課題を解決しおいきたす。次は最も効果が期埅できるスポヌツ玠材に挑戊したいず考えおいたす」ず意気蟌みを述べ、プレれンテヌションを結んだ。