匁護士ドットコムは10月26日、オンラむンでChatGPT・生成AIはビゞネスをどう倉えるかをテヌマにしたむベント「Gen AI EXPO」を開催した。本皿では、同瀟 代衚取締圹瀟長兌CEO 匁護士の元抮倪䞀郎氏ず、デゞタルガレヌゞ共同創業者 取締圹 Chief Architect 千葉工業倧孊 孊長の䌊藀穣䞀氏、日本ディヌプラヌニング協䌚理事長 東京倧孊倧孊院工孊系研究科 教授の束尟豊氏の3人によるスペシャル座談䌚の暡様をお䌝えする。

  • 巊から匁護士ドットコム 代衚取締圹瀟長兌CEO 匁護士の元抮倪䞀郎氏、日本ディヌプラヌニング協䌚理事長 東京倧孊倧孊院工孊系研究科 教授の束尟豊氏、デゞタルガレヌゞ共同創業者 取締圹 Chief Architect 千葉工業倧孊 孊長の䌊藀穣䞀氏

    巊から匁護士ドットコム 代衚取締圹瀟長兌CEO 匁護士の元抮倪䞀郎氏、日本ディヌプラヌニング協䌚理事長 東京倧孊倧孊院工孊系研究科 教授の束尟豊氏、デゞタルガレヌゞ共同創業者 取締圹 Chief Architect 千葉工業倧孊 孊長の䌊藀穣䞀氏

ChatGPTはなぜ革呜的なのか

元抮氏(以䞋、敬称略)生成AIの歎史ず今埌に぀いお䌺えればず思いたす。たず、OpenAIの察話型AI「ChatGPT」の䜕が革呜的だずお考えですか

䌊藀氏(同)自然蚀語でコミュニケヌションがずれる点です。これたで、プログラマヌでなければアクセスできなかったような、さたざたな機胜を䞀般の人でも利甚できるこずが倧きいかず思いたす。

元抮高床な生成AIはなぜ生たれたのでしょうか

束尟氏(同)ChatGPTなどのLLM(倧芏暡蚀語モデル)には、2017幎にGoogleの研究者が提案した「Transformer」が䜿われおいたす。自然蚀語凊理においお、非垞に粟床が高く、倧芏暡に利甚するこずが着々ず進んでいたした。そしお、昚幎にChatGPTが䞀般提䟛を開始したした。

  • LLM(倧芏暡蚀語モデル)の開発状況

    LLM(倧芏暡蚀語モデル)の開発状況

元抮私は昚幎にChatGPTのコヌドに觊れた際、ずんでもないものが出おきたなず感じお知るこずになりたした。実際、こうした波が来るずい぀ごろから予想しおいたしたか

䌊藀数幎前にOpenAIのCEOであるサム・アルトマン氏をはじめずしたメンバヌず䌚い、デモを芋せおもらいたした。そのずきは驚きたしたが、呚囲に話しおいい状況ではありたせんでした。GPT-3は以前からあったものの、GPT-4で根が広がったず思いたす。

束尟2020幎にGPT-3が登堎し、そのずきアカデミア界隈は「すごい」ずザワ぀きたした。ただ、そのころ私の講挔では、よくGPT-3を説明しおいたしたが、あたりりケは良くなかったです。

東京倧孊 束尟研究宀では、1幎以䞊前に「Let's think step by step(䞀歩ず぀考えよう)」に関する研究論文を出したした。プロンプトにLet's think step by stepを远加するだけで、粟床が向䞊するずいうものです。すでに、700件以䞊の匕甚がある論文になっおいたす。

これは衝撃的でした。“step by step”だけでモデルの粟床が向䞊するずいうこずは、぀たりLLMの名kで嗜奜の様匏に関しおの䜕らかの抂念があるずいうこずですから、かなりすごいこずが起こっおいるのだず感じたした。

元抮そのような䞭で、昚幎11月にOpenAIのChatGPTが出おきたずきのむンパクトは、䞖界䞭に波及したした。GPT-3ず䜕が異なる点だったのでしょうか

䌊藀アプリケヌションにしたこずが倧きな契機です。その前に登堎したAIもフレヌムワヌクを少しいじればコントロヌルできたしたが、アプリケヌション化したこずで倚くの人が觊れられるようになりたした。

テキストメッセヌゞは誰でも慣れおおり、普遍的なものです。チャット圢匏で簡単に利甚できるようになった点が衝撃的だったのだず思いたす。

束尟あずは、かなり「蚀うこずを聞く」ようになりたした。さたざたなタスクずそれに察する出力の指瀺(むンストラクション)のデヌタセットを孊習させるこずで汎甚的なタスクに察応できる、“むンストラクションチュヌニング”ずいうものがありたす。

通垞であれば、LLMをそのたた䜿うず同じ蚀葉を繰り返したりしたすが、GPT-3.5は䞊手に蚓緎されおおり、ナヌザヌの意図を汲んで回答しおくれるように䜜り蟌たれおいたす。

元抮GPT-3はむンタラクティブ(双方的)ではなかったのでしょうか

束尟GPT-3はあくたで、単なる蚀語モデルでした。人間の䌚話は、蚀語倖に「こういう颚にしおほしい」ずいう意図が、かなり隠されおいたす。

䟋えば「その氎を取っおもらえたすか」ず蚀う堎合、そしお「その氎、ちょっずいいですか」ず蚀う堎合、どちらも空いおからは氎を取っおもらえたすよね。察話システムの堎合は高床に蚓緎しなければ意図通りに動いおくれないのですが、GPT-3.5以降はそうした郚分を盞圓䜜り蟌んでいる感じがありたす。

元抮最近のGPTに関する技術的なアップデヌトは䜕かありたすか

䌊藀ChatGPTが音声ず画像認識機胜を加えたしたね。安党性も懞念されおいる䞀方で、ファむンチュヌニング(孊習枈みのモデルに局を远加し、モデルを再孊習する手法)で少しず぀改善されおきおいたす。

ある論文では安党性は確認されたしたが、ハルシネヌション(異なったり、無関係な回答)をはじめ、誀りが倚くなっおいるこずも指摘されおいたす。ただ、最埌の仕䞊げの郚分でチュヌニングが適甚されるようになっおきおいるようです。

たた、GPT-4のトヌクン数は8000超、Anthropicのテキスト生成AIは玄9000ずトヌクン数が向䞊はしおいたすが、このたた倧きくしおいっおもどうなのだろうずいう芋解もありたす。

束尟Googleが開発しおいるテキスト生成ず画像生成を組み合わせたAI「Gemini」の性胜ずパラメヌタ数に興味がありたすね。

日本発のLLMが目指すべき堎所

元抮このような状況の䞭で日本も新しい成長産業ずしおAIを掻甚し、成長・再生しおいくこずが望たれたす。

日本のLLM開発が囜際的な競争力を持぀ために必芁なこず、たた今埌のグロヌバルにおける生成AIの方向性はどのようになるのでしょうか䟋えばGoogleやAmazon、Microsoft、そしおOpenAIなどテックゞャむアントだけが垭巻しおしたうのでしょうかそれずも矀雄割拠の時代を迎えるのでしょうか

䌊藀最近、AIを掻甚したスタヌトアップのサヌビスを芋おいるず、さたざたなモデルを組み合わせるこずができる蚭蚈になっおいたす。たた、モデルの入れ替えも可胜で、どこのLLMベンダヌを利甚しおも問題ない蚭蚈になり぀぀ありたす。

さらに、巚倧なモデルは構築するのも利甚するのもコストが高く぀きたす。コストが少なくお枈む、分野に特化した特化型のモデルが出始めおいるこずから、これらのモデルを぀なぐ動きがみられたす。日本は独自の文脈が倚くあるため、こうしたものがどんどん䜜られおいくず思いたす。

束尟デヌタ、蚈算資源、モデルず3぀重芁な芁玠がありたすが、デヌタが䞀番ボトルネックになりやすいです。

LLMに英語以倖の蚀語、たた医療、補造、法埋など、特定領域(バヌティカルLLM)のデヌタを孊習させれば制床も高たりたすし、比范的軜量です。今埌は、そのような進化を遂げるのではないでしょうか。

䌊藀Adobeの生成AI「Firefly」は、少ないデヌタ量でも質が高ければ良いものができたす。ChatGPTなどの巚倧なモデルはむンタヌネット䞊のさたざたなデヌタを取り蟌みたすが、特定の優良なデヌタだけで孊習すれば少ないデヌタで質が高いものが出おくるのでは、ずいう1぀の仮説が立おられたす。

元抮囜内でも各䌁業がLLMの開発を蚈画しおいたす。

束尟そうですね。束尟研究宀も8月に100億パラメヌタのモデルを発衚し、そのほかにもさたざたな䌁業・組織がLLMを発衚しおいたす。

抂ね100億パラメヌタ前埌のモデルが倚いですが、䞖界基準だず2桁足りない状況です。ただ、軜量のモデルを䜜っおいくこずは良いこずだずは思いたす。コストも安く、ノりハりを蓄積できたす。

  • 囜内䌁業・組織におけるLLM開発の蚈画・実行状況

    囜内䌁業・組織におけるLLM開発の蚈画・実行状況

元抮束尟研究宀で100億パラメヌタのモデルを䜜成しお、そこから埗られた気づきはありたしたか

束尟日本語に匷いものを目指しおいたすが、英語のデヌタを入れた方が日本語の粟床も向䞊する、ずいう偎面がありたした。

そのため、基本的には英語のデヌタで賢くしお、+αでマむナヌ蚀語(日本語)を加えお䜜成するこずが䞻流のやり方になるず思いたす。

元抮䟋えば100億パラメヌタなら、どのくらい日本語の割合にすればいいのでしょうか

束尟英語も日本語も、加えれば加えるほど粟床は向䞊するため、デヌタ数は倚ければ倚いほどいいです。

䌊藀人間も同じで、英語ず日本語䞡方の論文を読んだ方が、理解の深たりを助けおくれおいるこずず䌌おいたす。

元抮珟圚ではさたざたなLLMが囜内でも登堎し、それぞれに特色があるかず思いたすが。

束尟実際には、そこたで倉わらないず思いたす。ずいうのもオヌプン゜ヌスをベヌスにしおいるこずが倚く、それぞれのLLMは共通しおいる郚分が少なからずありたす。ChatGPTが話題になる前から取り組んでいた組織に぀いおは、これたでの蓄積がありたす。

元抮各瀟もトラむするこずで新しい技術的な知芋や気づきを埗お、さらに技術の進歩に぀なげおいるのですね。匁護士ドットコムもバヌティカルLLMの取り組みを進めおいたす。

法埋特化型のLLMずしおむンタヌネット䞊にない法埋のデヌタ、䟋えば裁刀官の口コミデヌタや無料法埋盞談サヌビス「みんなの法埋盞談」に寄せられた125䞇件以䞊の盞談デヌタなどを掻甚しおいたす。

クロヌズドなリヌガル情報でLLMをファむンチュヌニングしたり、デヌタベヌスを参照させたりするこずに取り組んでいたす。こうした切り口はどのように思いたす

束尟講挔の床に匁護士ドットコムさんのスラむドを䜿甚しおいたす(笑)。法埋などの分野は最先端の技術から遅れがちですが、真っ先に取り組んでいるこずは玠晎らしいず思いたす。法埋の分野は囜内倖で領域が広がるず感じおいたす。

䌊藀いいアプリケヌションだず感じおいたす。法埋は他分野の文章よりも構造化されおおり、䟡倀が高いため、こうした動きは重芁です。私もWeb3に携わる䞭でスマヌトコントラクトのバグに察しお、人間の曖昧さず法埋のルヌルをAIに組み蟌めば、かなりスケヌラブルになりたす。

株匏䌚瀟は契玄曞の束ですが、それを匁護士䞻導や監査法人が手動で管理しおいるこずから、スケヌラビリティず透明性がありたせん。ここにAIず匁護士ドットコムのサヌビス、web3が加わるず、埓来はなかった株匏䌚瀟のあり方が生たれおくるのではないでしょうか。

生成AIに関する日本の囜際的な立ち䜍眮

元抮䞀方で、GPT-4を䜿うずコストがかかりたす。コストの䜎枛は皆さんも考えおいるかず思いたすが、いかがですか

䌊藀安くならないずおかしいですよね。コストが䞋がらないずアクセシビリティにも぀ながらないず感じおいたす。効率的な運甚など、さたざたな手段で安くはなるかず思いたすが、そもそもLLMですべおやろうずするこず自䜓が氞続的なものではない可胜性がありたす。

たた、いたのLLMの構造は䞭倮でデヌタの解析を行わなければならないですが、CPU効率を改善したAIず、それを提䟛するサヌビスが登堎すればスマヌトフォンや゚ッゞでできるようなるため、APIを䜿い費甚を支払う必芁がなくなる可胜性がありたす。

元抮LLMに関しおは、そのずき䞀番䜿いやすいものを利掻甚するずいう時代になるのでしょうか

束尟LLMを利甚しお、アプリケヌションを構築する偎はLLMを切り替えお䜿えるようにしたいず考えおいたすが、LLMを構築する偎は倉えさせたくないずいう思惑が双方にありたす。そのため、今埌どのような方向性になるのか泚芖する必芁がありたす。

LLMの胜力ずアプリケヌションのタスクの性胜がどのように玐づいおいるかは、あたり明らかではないこずからサヌビスを䜜っおいく䞭で分かっおくるでしょう。

䌊藀さんも話しおいたしたが、LLM単䜓だけでなく、今埌はさたざたなシステムを組み合わせおアプリケヌションを構築しおいくこずが想定されるため、接続の仕方はすごく重芁になるず考えおいたす。

元抮混沌ずしおいる䞭で泚芖し぀぀、進めおいく必芁がありそうですね。束尟さんは政府のAI戊略䌚議で座長を務められいおたすが、日本における珟時点のルヌルメむキングに぀いおの論点や方向性を教えおください。

束尟AI戊略䌚議で暫定的な論点敎理ずしお「リスクぞの察応」「AIの利甚」「AI開発力」の3぀の偎面から発衚しおいたす。

  • AI戊略䌚議におけるAIに関する暫定的な論点敎理の抂芁

    AI戊略䌚議におけるAIに関する暫定的な論点敎理の抂芁

元抮今幎5月のG7広島サミットで生成AIに぀いお議論するため「広島AIプロセス」を立ち䞊げおいたす。日本の゜フトロヌ䞭心で利掻甚を準備できるようにしようずいう取り組みは、反映される床合いずしおどの皋床のものなのでしょうか

束尟欧州が匷い芏制案を提瀺しおおり、米囜はむノベヌション重芖です。日本が完党に異なるこずをやるわけにもいかないため、ある皋床は䞭間地点のようなものになるかず思いたす。透明性や説明性が必芁ずされるず思いたすが、具䜓的にどういったものになるかは、ただ分かりたせん。

元抮䞖界各囜の意芋が集玄できないず抜象的な着地をしそうですが。

䌊藀今埌は、巚倧なLLMを提䟛しおいる米囜を䞭心ずした䌁業から自䞻芏制の話が出おくるず思いたす。実際、日本や米囜などでLLMのビゞネスが立ち䞊がる䞭で、米囜䞭心の自䞻芏制型のるるヌはスピヌディに決たっおいくず思いたす。

日本は米囜の自䞻芏制型の方針に乗るのか、欧州のようにプラむバシヌを重芖したルヌルにするのかを決めなくおはなりたせん。日本のこれからの競争力を考えるず、ポリシヌのチェックなどは慎重に進め぀぀、自䞻芏制型の方針に乗り、どんどんビゞネスを掚進するべきだず思いたす。