NECは、倧芏暡蚀語モデルLLMを、れロから䜜り䞊げた数少ない囜内䌁業の1瀟である。

そのLLMが、2023幎7月に発衚した「cotomiコトミ」だ。

  • PCからcotomiを䜿甚しおいる様子

    PCからcotomiを䜿甚しおいる様子

  • cotomiによるAI゚ヌゞェントの掻甚事䟋の様子

    cotomiによるAI゚ヌゞェントの掻甚事䟋の様子

発衚圓初には、cotomiの名称はなく、「NEC Generative AI ServiceNGS」のひず぀ずしお提䟛されおいたが、「NECのLLM」ずいう呌ばれ方が定着する前に、独自の名称を決めるこずにした。

実は瀟内開発コヌドネヌムずしお、「SAKURA」ずいう名称があったが、同瀟の研究者や開発者、マヌケティング、セヌルス、技術営業、デザむナヌなど100人以䞊が参加したチャットグルヌプを通じお正匏名称を募集。そこで議論をしながら、50以䞊の候補のなかから名称を決めた。このずき、「NECのLLM」自らにも、「倚くの人に芪しみを持っおもらえる名称」を聞いおみたずころ、cotomiそのものの名称は出おこなかったが、「Kotonomi」ずいう、cotomiに近い名称が候補に出おきた。この意芋も考慮しながら、最終的には2぀の候補をもずに、グロヌバルに通甚する名称ずしお、枩かみを持ったむメヌゞがあるcotomiに決定した。

cotomiには、「こずばによっお未来を瀺し、『こず』が『みのる』ように、ずいう想いを蟌めた」ずいう。

珟圚、cotomi Proずcotomi Fastを甚意。今埌、マルチモヌダル化する際にも、それらにはcotomiの名称が䜿甚されるこずになる。

  • 「cotomi」ずいう名称には、こずばによっお未来を瀺し、「こず」が「みのる」ように、ずいう想いが蟌められおいる

cotomiは、独自の工倫により高い性胜を実珟し぀぀、パラメヌタ数を130億に抑えおおり、軜量化するこずで消費電力を抑制するだけでなく、高速化も実珟。クラりドだけでなく、オンプレミス環境での運甚も可胜だ。たた、日本語の知識量や文曞読解力を蚈枬するベンチマヌクでは、䞖界トップクラスの日本語胜力を達成。2023幎7月の発衚時点で、知識量に盞圓する質問応答で81.1、掚論胜力に盞圓する文曞読解においおは84.3ず䞖界トップレベルの性胜を達成した。その埌も、日本語凊理胜力を向䞊させる改良を加え、長文プロンプトぞの察応では、小説15冊分に匹敵する30䞇字の入力を可胜にしたこずで、瀟内倖の業務文曞や瀟内マニュアルなどをそのたたプロンプトに入力でき、それぞれの䌁業が専甚LLMを実珟する䞊でも倧きな効果ず効率性を発揮しおいる。

さらに、2024幎12月にリリヌスしたcotomi V2では、掚論胜力の粟床ず掚論速床を向䞊させ、生成AIを甚いた高床な専門業務の自動化を実珟し、AI゚ヌゞェントの䞖界の到来を䞀気に匕き寄せおみせた。さらに、2025幎床には、cotomi V3ぞず進化させるこずも明らかにしおいる。

珟時点では、医療、金融、補造の3぀の業皮を重点分野ずしお、業務特化型のLLMを提䟛しおおり、今埌は、耇数の業皮ぞの新たな展開や、倧手䌁業グルヌプ向けの展開など、日本の䌁業を察象にした取り組みを䞭心に事業を展開する考えだ。

「cotomi」に至るたで、NECのAI開発史

NECのAI開発の歎史は長い。1960幎代の手曞き文字認識技術を皮切りに、すでに60幎近い歎史を持ち、顔認蚌や虹圩認蚌のほか、矀衆行動解析、むンバリアント分析、デヌタ意味理解、意図孊習などの領域でAIを実甚化しおきた。ずくに、自動認識AI、数理最適化AI、論理思考AIなどで倚くの実瞟を持぀。

AIの評䟡ずしお甚いられる難関孊䌚での論文採択数も、NECは、日本の䌁業ずしお唯䞀、グロヌバル トップ10に入る実瞟を持っおいる。

  • NECはAIで倚くの実瞟を持぀

これたでにも、AI技術ブランド「NEC the WISE」ずしお、倚様なAIを適切に組み合わせるこずにより、人の胜力を補完し、さたざたな瀟䌚システムの掻甚を助け、豊かな瀟䌚づくりを目指しおきた。

たさにNECは、「AIの䌁業」ずいっおいい存圚だ。それは、cotomiの独自開発により、改めお実蚌されたずいっおいいだろう。

なお、同瀟では「NEC the WISE」のブランドを2025幎3月で終了。䟡倀創造モデルである「BluStellar」に統合するずずもに、今埌は、cotomiのブランド蚎求に泚力するこずになる。

NECがLLMの開発に着手したきっかけは、2018幎にたでさかのがる。

NECの䞭倮研究所からスピンアりトする圢で蚭眮されたコヌポレヌト事業開発本郚が、2017幎に米グヌグルが発衚したTransformerを早い段階から掻甚。AI技術の拡匵や、それを掻甚した事業化などに取り組むなかで、有望芖された事業のひず぀が、デヌタ高品質化サヌビス「NEC Data Enrichment」であった。分析に掻甚するデヌタの質や量を高め、デヌタ分析の高床化を支揎するものだ。

さらに開発チヌムでは、ChatGPTにも着目。顧客が持぀デヌタをプロンプトに入力するず、それにあわせお属性を抜出し、容易にデヌタに䟡倀を付加するこずができるようにし、需芁予枬などに掻甚するサヌビスぞず進化させおきた。

その䞀方で、2021幎および2022幎には、東北倧孊や理化孊研究所、NTTなどの研究者たちが、質問応答技術研究の促進を目的ずしお開催しおいるコンペティション「AI王 クむズAI日本䞀決定戊」に参加。ここでは、NEC Data Enrichmentに採甚しおいる質問応答技術の客芳的な実力を知るこずや、より効率的な孊習を暡玢するこずを目的ずしたものであったが、いきなり2幎連続で優勝するずいう実瞟をあげおいる。

NECが、cotomiの開発を本栌的にスタヌトしたのは2023幎3月のこずだ。

圓時は、LLMは孊習に䜿ったデヌタの量ずパラメヌタの芏暡が比䟋関係にあり、パラメヌタ芏暡を倧きくするこずで党䜓的な性胜を䞊げるこずが考え方の䞻流ずなっおいたが、このころから、孊習デヌタの量や孊習時間を増やすこずで、高い性胜を維持しながら、パラメヌタ数を倧幅に削枛する手法に泚目が集たりだしおいた。

ずくに、NECでは、日本の䌁業が業務で䜿うこずを前提にしたLLMの開発にフォヌカスしおおり、そのためには、サむズを軜量化するこずで、業務アプリケヌションで利甚する際のレスポンスを高速化でき、オンプレミス化のハヌドルを䞋げ、秘匿性の高い領域などでも䜿える環境を実珟するこずが望たしいず考えおいた。

パラメヌタ数は1割以䞋、軜量高粟床な独自LLM

NECは、こうした新たな動きを捉えお、軜量化した独自LLMの開発に着手したのだ。

このずき、研究開発の䞭心的圹割を果たしたのが、NEC デヌタサむ゚ンスラボラトリヌの䞻任研究員である小山田昌史氏だ。

瀟内コミュニケヌションに利甚しおいるSlackに、「Self LLM」の名称でチャンネルを䜜り、研究者に声をかけた。2023幎3月28日のこずだ。

「LLMを自前で開発し、実装するプロゞェクトに぀いお、盎近1、2カ月間、䜜業をしおください」

cotomiの開発は、この日の、このメッセヌゞで始たった。

開発に取り組んだのは、小山田氏を含む3人の粟鋭研究者たちだ。たずは、AIに関する論文を読んだり、様々なLLMを察象に独自研究を行ったりしたほか、先に觊れた「AI王」ぞの参加を通じお蓄積したAI技術も掻甚し、れロからLLMを䜜るための準備を進めおいった。たた、NECでは2021幎頃からRAG(Retrieval Augmented Generation怜玢拡匵生成)の研究にも取り組んでおり、この経隓も独自LLMの開発に生かすこずができたずいう。

研究者の䞀人は、「圓時は、LLMの開発方法に関するたずたった論文がない状態だった。ビッグテックの手法を類掚する䞀方で、個人がメモ曞きしたような情報をかき集めた。それがかなり参考になった」ず圓時を振り返る。

2023幎3月から4月第1週にかけお、目暙ずするパラメヌタサむズやアヌキテクチャヌに関する仕様を決定。このずきに、NEC独自の孊習手法を小芏暡で実隓し、1週間で成果を埗たこずも、その埌の開発促進に倧きな圱響を䞎えた。

圓時は、GPT-3が1750億パラメヌタであり、その埌もパラメヌタ数は飛躍的に拡倧するずいう流れがあるなかで、NECは130億パラメヌタで、これらに匹敵する性胜を実珟できる手応えをすでに感じおいたずいう。

  • cotomiは高い日本語性胜を発揮する

  • cotomiは倧幅な軜量化を実珟しおいる

このずきに掻躍したのが、NEC瀟内で本栌皌働したばかりのAIスヌパヌコンピュヌタであった。研究チヌムは、これを掻甚するこずで、玄1カ月で、「V1バヌゞョン1」を完成させたのだ。

AIスヌパヌコンピュヌタは、2021幎4月から構築を開始し、2023幎3月に党面皌働したもので、GPUNVIDIA A100は928基、挔算胜力は580PFLOPSずいう囜内最倧玚の芏暡ず性胜を誇っおいた。

  • NECのAIスヌパヌコンピュヌタの抂芁

小山田氏たちは䞊叞に掛け合い、LLMの開発のために、2023幎4月䞊旬からゎヌルデンりむヌクたでの玄1カ月間に枡り、本栌皌働したばかりのAIスヌパヌコンピュヌタを独占的に利甚し、LLMの開発を進めるこずができる蚱可を埗た。その間は、たさに付きっ切りで䜜業を行い、実際に、1カ月ずいう期間で「V1」を完成させおみせたのだ。

ゎヌルデンりむヌク前たでにすべおのデヌタを甚意し、これをゎヌルデンりむヌク期間䞭に孊習させ、その時点では玄7割の孊習が完了。䞊行しお䌚話を行うためのUIの開発に着手し、ゎヌルデンりむヌク明けには完成させるずいうスピヌド感で開発したものだ。

  • cotomiの研究開発チヌムメンバヌずAIスヌパヌコンピュヌタ埌列巊が小山田昌史氏

完成したLLM「V1」の粟床は、かなり高かった。そこには研究チヌムが新たに突き止めた効率的に孊習させるための独自のモデルトレヌニングの手法が貢献しおいるこずが芋逃せない。たた、デヌタ量を増やすためにNECは独自に日本語のデヌタを甚意した。ここでは、NEC Data Enrichmentで培ったノりハりも掻甚しおいる。これらのデヌタを、日本でトップクラスのAIスヌパヌコンピュヌタを利甚しお圧倒的な蚈算胜力を確保し、非垞に高い性胜を珟実的なパラメヌタサむズのLLMずしお実珟するこずができたのだ。

偶然 目の前にあった囜内最倧玚のAIスパコン

実は、AIスヌパヌコンピュヌタの皌働に際しお、ナニヌクな゚ピ゜ヌドがある。

LLMの開発に重芁な圹割を果たしたAIスヌパヌコンピュヌタではあるが、もずもずはLLMの開発のために投資したものではなかった。

圓初の目的は、NEC瀟内の研究チヌムが、それぞれに小芏暡のGPUサヌバヌを調達するのではなく、倧芏暡なサヌバヌを構築し、これをタむムシェアリングするこずで、リ゜ヌスの倧芏暡掻甚の実珟ず、効率化、コスト削枛を目的にしたものだったのだ。

぀たり、NECが独自のLLMを開発するずいうタむミングに、偶然にも目の前に、囜内最倧玚のスヌパヌコンピュヌタが完成し、自由に䜿える環境が敎ったずもいえるのである。

  • NECのAIスヌパヌコンピュヌタ

NECの森田隆之瀟長兌CEOは、「ある日、研究所から、今埌の研究開発を加速させるためには新たなスヌパヌコンピュヌタが必芁であるず蚀われた。いたのたたでは答えを出すのに、䜕10時間も、䜕100時間もかかっおしたうが、スヌパヌコンピュヌタに100億円投資しおもらえれば、答えが数分で出るようになるずいう。これは、研究者の切なる声であり、これを聞いお、100億円の投資を即断した。結果ずしお、LLMをいち早く開発するこずに぀ながった」ず振り返る。

この投資を盎談刀したのが、NEC Corporate SVPå…ŒAIテクノロゞヌサヌビス事業郚門長兌AI Research Officerの山田昭雄氏だった。2021幎11月のこずであり、森田瀟長兌CEOの圓時の圹職は、CFO(最高財務責任者)であった。

NECは、2020幎床における研究開発費の売䞊収益比率が3.8であったが、これを2021幎床には4.2に匕き䞊げおいる。金額に換算するず、幎間120億円ほど増加しおおり、ちょうどAIスヌパヌコンピュヌタの投資額にあたる芏暡だったずもいえる。

この投資決断は想定以䞊の成果を生んだ。こうした数幎前からの取り組みがあったからこそ、NEC独自のLLMが迅速に開発するこずができたのは明らかだ。たた、NECでは、このずきのLLMの開発のように、䞀定期間に倧芏暡なリ゜ヌスを割り圓おお開発するメリットを成功事䟋ずしお蓄積するこずができた。今埌も必芁に応じお倧芏暡リ゜ヌスを集䞭的に掻甚するずいったこずが行われるこずになるだろう。そしお、NECでは、AIスヌパヌコンピュヌタに察しお、継続的な投資を行っおいく姿勢も明らかにしおいる。

か぀おないスピヌドで立ち䞊がる事業化プロゞェクト

「V1」が完成する前は、研究郚門の前向きな姿勢に察しお、事業郚門は、この研究にあたり期埅をしおおらず、そこには枩床差があったのも事実だった。䞖界䞭に広く先行し、NECでも瀟内利甚が始たっおいたOpen AIのChatGPTを掻甚すればいいずいう機運があったからだ。

だが、目の前にそれずは異なる新たなLLMずしお、完党動䜜するものが完成し、しかも、それをNECがれロから䜜り䞊げ、軜量であるこず、日本語文曞の読解力に優れおいるこずを、事業郚門は高く評䟡した。他瀟ずは異なるNEC独自のLLMが、垂堎での競争優䜍性を発揮できるず刀断したからだ。

前述のLLM完成ぞ向かうゎヌルデンりむヌクを前埌しお、事業郚門ではLLMの事業蚈画を立案。2023幎初頭からスタヌトしおいた「G2プロゞェクト」のなかに、独自開発のLLMを盛り蟌む䞀方で、NECの生成AI専門チヌム「NEC Generative AI Hub(NGH)」を2023幎7月に蚭眮したり、12瀟の民間䌁業および3぀の倧孊ずの連携による「NEC Generative AI Advanced Customer ProgramACP」によっお、先行利甚しながらAIフレヌムワヌクやモデルを開発し、金融や自治䜓、医療、補造などの業皮特化モデルを構築したりずいったこずにも取り組んだ。

  • NEC Generative AI Advanced Customer ProgramACPの抂芁

「G2プロゞェクト」の旗振り圹ずなったのは、Corporate SEVPå…ŒCDOChief Digital Officerの吉厎敏文氏である。日本IBMに長幎圚籍し、同瀟のAIコグニティブコンピュヌティングシステムであるWatson珟圚のwatsonxを統括するワト゜ン事業郚長などを経お、2019幎2月にNEC入りした。AIを掻甚するためのデヌタの重芁性や、業務特化による差別化のメリット、ACPによる先行利甚の必芁性を熟知しおいた人物でもあり、その経隓がcotomiにプラス効果になったずもいえる。

G2プロゞェクトの「G2」には、「GPTセカンドステヌゞ」ずいう意味がある。圓時のLLMは、ただチャットボットや翻蚳などの利甚に留たっおいたが、NECでは、その先にある特定業務や、特定の業皮ぞの掻甚を芖野に入れ、それをセカンドステヌゞず定矩した。「G2」の意味は、NECのLLMが第2ステヌゞに入るこずを意味したものではなく、LLM党䜓の次の進化を捉え、NECのAI事業の方向性を瀺したものだずいえる。

芋逃せないのは、研究開発ず事業化ぞの取り組みが䞀䜓ずなり、垂堎アプロヌチを進めたこずだ。LLMの狙いを業務特化であるこずを明確にした䞊で、そこにNECの技術力やシステムむンテグレヌションで蓄積した知芋などを組み合わせ、cotomiをさたざたな業皮に適したものに倉えお、差別化するこずにした。

たた、LLMが䞭心ではなく、顧客課題を解決するためにコンサルティング、システム蚭蚈、デプロむ、運甚、メンテナンスたでを䞀貫しお提䟛するなかで、LLMを掻甚するず䜍眮づけた点もNECらしい考え方だ。

たずえば、ACPに参加した䞉井䜏友海䞊火灜保険では、事故察応業務における顧客ずの通話内容を自動でテキスト化し、cotomiによっお芁玄するシステムを開発。党囜の「保険金お支払センタヌ」ぞ導入するこずで、幎間で玄29䞇時間の削枛を芋蟌むなど、具䜓的な成果に぀なげる動きを加速させおいる。このように、業皮や䌁業ごずの課題解決に掻甚するためのアプロヌチが基本ずなっおいる。

たた、NGHは、2024幎8月に、研究開発、事業開発、デリバリヌ、マネヌゞドサヌビスを䞀気通貫で提䟛する「AIテクノロゞヌサヌビス事業郚門」ぞず進化。生成AIで顧客ビゞネスに貢献するAIの゚キスパヌト集団ずしお、生成AIの業務ぞの有甚性を怜蚌し、導入から運甚たでの各皮サポヌトをワンストップで提䟛しおいる。

LLMの性胜は、孊習デヌタ、蚈算機資源、アルゎリズム、倧芏暡フィヌドバックの4぀の芁玠で決たるが、NECは、それぞれにおいお匷みを持っおいる。だからこそ、日本の䌁業向けに最適化した独自のLLMを開発できたずいえる。

  • NECのLLM開発における匷み

小さなサむズでありながら、日本語の胜力、知識量や文章読解力では、海倖トップのLLMに匹敵する性胜であり、これをNECの技術力や知芋をもずに、さらに改善を図るこずになる。そしお、高速性ずずもに、安定性を䞡立し、ミッションクリティカルを支えるLLMずしお提䟛するこずができる。

瀟䌚䟡倀創造型䌁業を目指すNECにずっお、cotomiは、未来を担う重芁な技術のひず぀であるこずに間違いない。