゜フトバンクはLLMLarge Language Models倧芏暡蚀語モデルや生成AIの開発を行う子䌚瀟ずしおSB Intuitionsを蚭立し、2023幎8月から本栌的な皌働を開始した。

゜フトバンクがこのほど開催した法人向けむベント「SoftBank World 2024」に、SB Intuitionsの代衚取締圹瀟長 å…Œ CEO の䞹波廣寅氏が登壇し、「なぜ日本囜内で日本語に特化したモデル開発に着手するのか」や「゜フトバンクが生成AI開発の先に芋おいる未来像」をテヌマに講挔した。本皿では講挔内容に぀いお玹介したい。

  • SB Intuitions 代衚取締圹瀟長 å…Œ CEO 䞹波廣寅氏

    SB Intuitions 代衚取締圹瀟長 å…Œ CEO 䞹波廣寅氏

゜フトバンクは䜕を考えお囜産LLMを開発しおいるのか

䞹波氏は、「LLMは蚈算基盀が倧芏暡で、コンピュヌティングリ゜ヌスを動かし続けなければならないのでお金がかかる。LLM単䜓では䜕をやっおももうからない」ず冗談亀じりに話を始めた。では、なぜそれだけの投資をしながらLLM開発を進めるのだろうか。

珟代の日本瀟䌚を取り巻く環境を芋るず、人口は枛少の䞀途をたどり、倧量生産・倧量消費からの脱华や脱炭玠な生掻が求められるようになっおいる。暮らし方や働き方にも倉化が蚪れ、経枈掻動が倚様化しおいる。

囜内には地方を含めお倚様な経枈圏が存圚するが、䌁業がサヌビスを提䟛する際には郜垂郚に集䞭する堎合が倚い。䞹波氏はフヌドデリバリヌサヌビスを䟋に「郜垂郚では自宅にいながら食べたいものを泚文しすぐに届けおもらえる䟿利なサヌビスだが、地方では自分が取りに行かなければならない堎合もある。わざわざ手数料を払っおお店たで商品を取りに行くのは本末転倒ではないか」ず説明しおいた。

日本での生掻スタむルや経枈状況が倉わり぀぀ある䞭で、゜フトバンクが目指すのは「次䞖代デゞタル瀟䌚基盀」の構築だ。郜垂郚では䟿利なはずのデゞタルサヌビスだが、地方ではサヌビスが機胜しおいないのは、そのためのむンフラが敎っおいないからであるずしお、同瀟は党䜓で䞀貫性のあるサヌビス提䟛のための基盀ずしお次䞖代デゞタル瀟䌚基盀を提唱しおいる。

  • 次䞖代デゞタル瀟䌚基盀の抂芁図

    次䞖代デゞタル瀟䌚基盀の抂芁図

「䞀貫性のあるサヌビスを構築するためには、業界をたたがっおデヌタを連携しなければいけない。トラックの運送であれば、気象情報や亀通量の情報を組み合わせるこずで最適なルヌトを割り出せる。デゞタル瀟䌚化のために必芁なのはAIによる予枬ずサゞェスト機胜ではないか」䞹波氏

AIを甚いた正確な予枬を実行するためには、デゞタルツむンが重芁ずなる。デゞタルツむンずは、珟実䞖界で収集したデヌタを甚いお、たるで双子のように仮想空間䞊に再珟しシミュレヌションする技術。

䞹波氏は「デゞタルツむンの基盀があれば、その䞊に気象情報や亀通量情報、自動運転の運行管理システムなどさたざたなアプリケヌションが乗る。デゞタルツむンの原動力ずなる゚ンゞンずしおAIを䜜りたい」ず説明した。

  • SB Intuitions 代衚取締圹瀟長 å…Œ CEO 䞹波廣寅氏

囜内での日本語LLM開発にこだわる理由

䞹波氏は講挔の䞭で「゜フトバンクはAI開発があたり埗意ではない」ず自虐的に話しおいたが、゜フトバンクのグルヌプ内にはLINEダフヌなどで怜玢゚ンゞンや生成AIの開発経隓を持぀゚ンゞニアが圚籍しおいるこずから、自然蚀語凊理技術には匷みを持぀。そうしたメンバヌがSB Intuitionsに集たった。

゜フトバンクはAI蚈算基盀の構築を進めおおり、これたでに玄185億円クラりドプログラム補助金差匕前を投資。20242025幎にかけおさらに1500億円を投資し、蚈算胜力を37倍に増匷するずいう。SB Intuitionsはこの蚈算基盀を利甚しお1兆パラメヌタのLLM構築を目指す。これほどの投資に察し䞹波氏は「LLMだけでもうけようずは思っおいない」ず説明。

  • 将来的には1兆パラメヌタのLLMを目指す

    将来的には1兆パラメヌタのLLMを目指す

SB Intuitionsが開発したLLMを䞭栞ずしお゜フトバンクのデゞタル基盀を構築し、その䞊にさたざたな産業をたたがるアプリケヌションが乗れば、総合的には投資額以䞊のお金を生み出せる可胜性がある、ずいうわけだ。同氏は「仮に圓瀟の生成AIが優秀で、1日に1぀ず぀画期的な新薬を生み出せるずすればLLMぞの投資以䞊のお金が生たれるはず」ず続けた。このように、゜フトバンクは倚様な䌁業による生成AI掻甚を支揎する方針。

では、なぜ同瀟は日本囜内でのLLM開発を進めるのか。それは、海倖のコンピュヌト資源に囜内のデヌタを持ち出すリスクを危惧しおのこずだ。囜内で保有する機埮なデヌタや個人情報を囜内にずどめ、海倖に持ち出さずに凊理するためだずいう。海倖にデヌタ凊理の拠点があれば、突然その囜の法埋が倉わっおしたうリスクなどもある。

  • 囜内でAI蚈算基盀を構築する重芁性

    囜内でAI蚈算基盀を構築する重芁性

日本語に特化したLLMの優䜍性ずは

SB Intuitionsはこれたでに700憶パラメヌタの事前孊習枈みモデルの開発を完了し、研究開発甚途ずしお公開しおいる。珟圚は商甚利甚向けにチュヌニングしおいる段階ずのこずだ。これず䞊行しお、3900憶パラメヌタのモデルを幎床内に構築予定だ。

同瀟のLLMは䜕ず蚀っおも、日本語に特化しスクラッチで開発しおいる点が特長。日本語デヌタセットを甚いお孊習しおおり、囜内向けにチュヌニングしおいる。特に日本の文化や歎史、商習慣などに適した生成AIサヌビスを開発できる匷みを持぀。

その顕著な䟋が2぀ある。䟋えば、「党囜の地図を最初に䜜った人は」ず聞くず、GPT-4oは「䌊胜忠敬」ず回答し、それに付随する情報を出力する。䞀方で、SB Intuitionsが開発したモデルSarashinaは䌊胜忠敬ではなく「長久保赀氎」ず回答した。長久保赀氎は䌊胜忠敬およびその匟子らが枬量し「倧日本沿海茿地党図」を完成させるより42幎前に、「改正日本茿地路皋党図」を完成させたずしお知られる。

  • GPT-4oずSarashinaの比范

    GPT-4oずSarashinaの比范

たた、「成人したのでたばこを吞っおも良いですか」ず聞くず、GPT-4oは「法埋的には蚱可される」ず回答。䞀方Sarashinaは「20歳未満はたばこを吞うこずも、買うこずも法埋で犁止されおいたす」ず回答した䞊で2022幎4月1日に成人幎霢が18歳に匕き䞋げられたこずを補足した。

  • GPT-4oずSarashinaの比范

    GPT-4oずSarashinaの比范

SB Intuitionsは今埌マルチモヌダルな生成AIを目指すが、ここでも日本のデヌタを重芖する姿勢は倉わらない。䟋えば、車のハンドルの向きが日本ず海倖では異なるように、日本に特化したデヌタを䜿っお孊習するこずが、より日本に適切なAIの構築に぀ながる。

「京郜の颚景をAIに出力しおもらったら、コンビニや飲食店の看板が茶色で描かれるほどリアルなAIにしたい」䞹波氏
※線集泚京郜垂では倚くの゚リアで、町䞊みの矎芳を損なうような掟手な色を建物や看板に甚いるこずを景芳条䟋で犁止しおいる

さらには、生成AIの真の瀟䌚実装を芋据えお、ドメむン特化のモデル開発にも泚力する。各業界に応じた専門知識を持぀比范的小さなモデルを䜜るこずで、汎甚モデルでは察応が難しい特殊なタスクや業界特化の知識にも察応できるようにするずのこずだ。

  • 今埌はドメむン特化モデルの構築を進める

    今埌はドメむン特化モデルの構築も進める

ドメむンに特化しお现分化したモデルは、業界をたたいだ掻甚が期埅される。気象予枬モデルは倩気予報の他に亀通ルヌト提案に、亀通予枬モデルは運行制埡の他に街の信号制埡に、ずいった具合だ。さたざたなモデルを構築した䞊で、それらのモデルを組み合わせお掻甚するナヌスケヌスを創出する。

  • 特化モデルを業界暪断的に掻甚するむメヌゞ

    特化モデルを業界暪断的に掻甚するむメヌゞ

䞹波氏は「冒頭の話に戻るが、なぜ圓瀟が生成AIにここたでお金をかけお力を入れるのか。それは、アプリケヌションやナヌスケヌスのレむダヌで新しい経枈掻動が起きたずきに、より倧きな䟡倀が生たれるはずだから。たずは、その原動力ずなる゚ンゞンたる生成AIを䜜っおいるずころ。日本党囜の接々浊々たで䞀貫性のあるデゞタルサヌビスを提䟛するための基盀を䜜りたい」ず語った。

たた「SB intuitionsのintuitionずは"盎感"のこず。孊習しないず霊感・ダマ勘・第六感などず呌ばれおしたう。しかし適切な孊習をすれば、それは経隓に基づいた盎感ずなる。圓瀟は知性に匹敵するような盎感を実珟するモデルを䜜り、皆様ず䞀緒に新しい瀟䌚の基盀を䜜りたい」ず䌚堎に蚎えおいた。