2022幎は、生成AIの転換点ずしお長く蚘憶されるこずになるでしょう。分類や予枬だけでなく、テキスト、画像、動画、さらには実行コヌドなどのコンテンツの自動生成や、業務効率化、アむデアの創出など、生成AIには倚くのメリットが期埅されおいたす。

ChatGPTやStableDiffusion、Midjourneyずいった倧芏暡基盀モデルが2022幎に登堎し、ほんの数幎前たではたるでSFの䞖界だった機胜を実珟するこずで広く泚目されたした。基盀モデルずは、さたざたなタスクに適応できるように、倚様なデヌタを含む膚倧なデヌタを甚いお事前にトレヌニングされたディヌプラヌニングアルゎリズムのこずです。

これらの基盀モデルは目を芋匵るような回答を導き出したすが、その最も際立った特城は、完党ずも蚀える柔軟性にありたす。過去10幎間の最先端の機械孊習モデルずは異なり、基盀モデルは、詩を曞いたり、物理孊を解説したり、なぞなぞを解いたり、絵を描いたりず、本圓に驚くべきコンテンツを生み出し、驚異的な範囲に及ぶ問題を解決したす。さらに、トレヌニングず人間のガむドを加えるこずで、その応甚範囲は栌段に広がっおいくのです。

基盀モデルがもたらす仕事の未来

技術者でもあり研究者でもある筆者は、AIずは人々の生掻を単に向䞊させるだけでなく、根本から倉えるものず長い間信じおきたした。特に、察話型AIを研究すればするほど、テクノロゞヌの力を掻甚するのに、専門知識は䞍芁になっおいるこずを確信するようになったのです。AIは、これたでにないパワヌず柔軟性、そしおパヌ゜ナラむれヌションを備えたツヌルをすべおの人に届け、操䜜に必芁なのは自然蚀語だけです。AIは、私たちの生掻のさたざたな堎面で、匷力な協力者の圹割を担っおくれるでしょう。

゚ンゞニア、マヌケタヌ、営業担圓、カスタマヌサポヌトのスペシャリストにずっお、日々の業務におけるAIの圹割は、今埌たすたす拡倧しおいくでしょう。Salesforceでは、䜕幎も費やしお、セヌルス、サヌビス、マヌケティング、およびコマヌスにおよぶビゞネスアプリケヌションに最先端のAIを組み蟌んできたした。珟圚、圓瀟のCustomer 360プラットフォヌムでは、AIを掻甚しお1日あたり2,000億件を超える予枬を生成しおいたす。

しかし、生成AIが起こす革呜は本圓に目前に迫っおいるのでしょうか、それずもはるか圌方にあるのでしょうかこの議論は、報道されおいる内容よりも極めお耇雑です。

筆者は、Salesforce Researchの゚グれクティブバむスプレゞデント兌チヌフサむ゚ンティストずしお、この問題に぀いお独自の芖点を持っおいたす。私たちは、䞖界の最倧手䌁業の䞭で業務を遂行し、䜕十億人もの人々にサヌビスを提䟛し、瀟䌚のあらゆる偎面に関わる産業に埓事しおいたす。぀たり、お客様に提䟛するすべおのサヌビスは、ミッションクリティカルな信頌性が求められたす。そしお、その信頌性は氞続的であるべきです。

たた、生成AIの嚁力を吊定する人はいたせんが、それが信頌できるかどうかは党く別の問題なのです。

生成AIが持぀2面性新たな胜力に䌎う新たなリスク

生成AIは、マシンむンテリゞェンスずのたったく新しい察話を玄束するものですが、同時にたったく新しい皮類の障害、「自信のある倱敗」も匕き起こしたす。質問に答えたり、迅速に応答したりする際に、生成AIが醞し出す、萜ち着いた、しばしばプロフェッショナルなトヌンは、さも正解を導き出したような印象を䞎えたすが、間違いがある際には極めお深刻です。専門家であっおも生成AIの説埗力に䞍意を突かれるこずはよくあるこずなのです。

䟋えば、2022幎12月にシカゎ倧孊ずノヌスりェスタン倧孊の研究者らはChatGPTを䜿甚しお、5぀の医孊雑誌の実際の論文から匕甚したタむトルをもずに抄録を生成したした。その埌、本物ず架空の芁玄を織り亀ぜおブラむンドレビュヌを実斜したずころ、プロのレビュアヌはChatGPTが生成した架空の抄録の32%を本物ず誀認し、本物の抄録の14%をChatGPTが生成した架空のものず誀認しおしたったのです。

これは課題ずしおは耇雑ですが、ずおもわかりやすい事䟋です。マサチュヌセッツ工科倧孊、カリフォルニア倧孊ロサンれルス校、およびテキサス倧孊オヌスティン校から参集した認知科孊者チヌムは、2023幎1月18日に発衚された論文「DISSOCIATING LANGUAGE AND THOUGHT IN LARGE LANGUAGE MODELS: A COGNITIVE PERSPECTIVE倧芏暡蚀語モデルにおける蚀語ず思考の分離 認知的芖点」の䞭で、生成AIを支えおいるモデルを人間の脳になぞらえお分析した結果、2぀の結論が埗られたした。

テキストデヌタでトレヌニングする倧芏暡蚀語モデルLLMのような基盀モデルは、人間の蚀語胜力の䞀぀である、文法、掻甚、単語の遞択などのルヌルに埓う耇雑だが衚面的な胜力を衚す「圢匏蚀語胜力」をマスタヌしおいたす。その䞀方で、歎史の知識、垞識、掚論胜力などの非蚀語的スキルを衚珟するための「機胜蚀語胜力」に぀いおは、ほずんど䜕もマスタヌできおいたせん。

芁するに、LLMは蚀語の達人ですが、蚀語だけなのです。完璧に曞かれたパラグラフを䜜る胜力は、そのパラグラフの構成文が実際に䜕を意味するのかずは党く切り離されおいるのです。

こうした偏りは倧倉危険で、これらのツヌルが珟実䞖界でミッションクリティカルな圹割を果たすようになる前に是正されるべきです。

生成AIのナヌスケヌスず同様に信頌性の課題もさたざた

しかし、生成AIの技術が䌁業党䜓にもたらす可胜性の倧きさを考慮するず、これは立ち向かう䟡倀のある課題であるこずは明らかです。アヌトワヌクや散文、コヌドのような耇雑なコンテンツを䜜成したり、さたざたな゜ヌスからの情報を芁玄し、短文や察話圢匏の質疑応答で提䟛したりするこず、たた、リアルな䌚話のような情報怜玢や、分析結果をより理解するのに生成AIは圹立ちたす。これらは革呜的な可胜性であり、探求する䟡倀が十分にありたす。

それぞれのナヌスケヌスのいずれにおいおも、䟝然ずしお人間の介入が必芁になりたすが、その皋床や堎面はさたざたです。䟋えば、AIが生成したマヌケティングコピヌを䞖に出す前に、人間の線集者が事実確認を行い、改良を加えるこずがありたす。たた、非デザむナヌが広告バナヌやメヌルのレむアりトをAIに委ねるようなケヌスでは、その生成物をそのたた受け入れるか、たったく䜿わないかの二者択䞀になるこずもありたす。さらに高床な甚途では、AIが共同䜜業に携わり、プロゞェクトにおける䜎レベルのタスクを自動化するこずで、専門家はより高床な課題にその創造力を集䞭させるこずができたす。

䟋えば、IT管理者がカスタムアプリケヌションを構築する際に、コヌド生成モデルをパヌトナヌずしお䜿甚する堎合を考えおみたしょう。AIは、簡単なプロンプトに応じおルヌチンコンポヌネントやサブシステムを生成したす。䟋えば、「各ネットワヌクにちなんだ名前のディレクトリにログファむルを敎理し、6カ月以䞊経過した既存ファむルを自動的に削陀する」ずいうようなプロンプトです。そうすれば、人間は独自の䟡倀を提䟛する斬新な問題解決のロゞックの開発に専念できたす。

こういったワヌクフロヌには人間による監芖が欠かせたせんが、AIをより安党で透明性の高いパヌトナヌにするために、私たちにできるこずは数倚くありたす。その倚くは、ナヌザヌがAIの長所ず短所をより深く理解するこずから始たりたす。アルゎリズムも圹に立ちたす。䟋えば、生成AIの暙準的な郚分ずしお、信頌床モデルがそのアりトプットを正しいず信じられる床合を衚瀺するこずが必芁です。䜎評䟡のコンテンツにもそれなりの䟡倀はありたすが、人間がレビュヌするこずで、より深いレベルの粟査が可胜になりたす。たた、AIシステムがコンテンツを䜜成した理由ず方法を説明したり、情報源を明らかにしたりすれば、信頌性ず正確性の問題に察凊するこずもできたす。

これは研究者にずっお将来的な問題ではありたせん。SalesforceのAI補品は、すでに信甚ず信頌を念頭に眮いお構築されおおり、その䞭にはお客様が倫理的情報に基づく遞択をする際の指針ずなるガヌドレヌルも含たれおいたす。

著者シルノィオ・サノァレヌれSilvio Savarese
Salesforce Research ゚グれクティブバむスプレゞデント兌チヌフサむ゚ンティスト