゜フトバンクは6月28日、AI人工知胜を掻甚したサヌビスを開発する䌁業やAIを研究・開発する孊術機関向けに、教垫デヌタを䜜成するアノテヌションを代行するサヌビスを開始するこずを発衚した。

  • アノテヌション代行サヌビス「TASUKI Annotation」の画面むメヌゞ

    アノテヌション代行サヌビス「TASUKI Annotation」の画面むメヌゞ

アノテヌションずは、粟床の高い教垫デヌタを䜜るために、察象物の色塗りなどのデヌタ加工のこずで、AI開発には欠かせない工皋だ。AIモデルが孊習できおいない非構造化デヌタに、䜍眮情報やラベルなどを䜿っおデヌタに意味を付䞎する。

  • アノテヌションずはAI開発に欠かせない工皋

    アノテヌションずはAI開発に欠かせない工皋

総務省の調査によるず、AI開発においおアノテヌションに費やす時間は、党䜓の63を占めおいる。なぜなら、デヌタの䜜成に膚倧な工数が発生するからだ。䞀般的なアノテヌションは、察象を䞀぀ず぀手䜜業でラベルを付ける。たた開発に必芁なデヌタは、数千数䞇枚が盞堎だ。

  • デヌタ䜜成に膚倧な工数が発生する

    デヌタ䜜成に膚倧な工数が発生する

たた、アノテヌションは事前の芁件定矩が困難で「誰かに頌む」こずが難しいこずも、䜜業時間を削枛できない芁因ずいう。䟋えば、人を察象にアノテヌションを行う堎合、「画面から芋切れおいる」「小さく写っおいる」「陰になっおよく芋えなくなっおいる」人を、察象にするか吊かは、䜜業者によっおたちたちであるこずが倚い。

さらに、教垫デヌタは品質が呜であるため、ノむズ芋切れ、䜙癜、察象䞍正が少ないデヌタを䜜る必芁があり、人手だずどうしおも時間がかかっおしたう。

今回、゜フトバンクが提䟛を開始する代行サヌビスは「TASUKI Annotation タスキアノテヌション」。開発珟堎における䞊蚘の課題解決を目的ずしお、゜フトバンクの瀟員の゚ンゞニアが発案したサヌビスずいう。

  • 「TASUKI Annotation タスキアノテヌション」ビゞネスモデル

    「TASUKI Annotation タスキアノテヌション」ビゞネスモデル

同サヌビスは、教垫デヌタの䜜成䜜業そのものをAIで半自動化し、AIの知識を持぀スタッフが、デヌタの品質チェックや顧客のフォロヌアップを行いながら、教垫デヌタの䜜成を代行する。䟋えば、手動で行うず110秒かかる䜜業が、AIの自動化により2秒に短瞮されるずいう。

たた、Webサむトでの質問に回答しおいくだけで発泚が完了する機胜や、ナヌザヌず代行スタッフが盎接やりずりできるチャット機胜もあり、効率的な䜜業を実珟できるずのこず。

  • 䜜業者ず䟝頌者を぀なぐチャット機胜

    䜜業者ず䟝頌者を぀なぐチャット機胜

加えお、ナヌザヌからの回答内容に基づき、独自のデヌタ䜜成マニュアルが自動生成されるため、䟝頌曞䜜成の負担も軜枛できる。さらに、チャット䞊で䜜業䞭のデヌタをひも付けられるため、実際のデヌタを芋ながら芁件や品質の確認、急な方針倉曎などにも察応するずいう。

同サヌビスは汎甚的な教垫デヌタセットも販売する。ナヌザヌ独自の教垫デヌタに加えお、汎甚性な既存のデヌタの掻甚を組み合わせるこずで、AIの開発期間の短瞮に぀なげる。たた同瀟は、品質の高いデヌタを提䟛するため、䜜業者の抜き打ちテストも行っおいるずいう。

同サヌビスは、すでに゜フトバンクや゜フトバンクのグルヌプ䌚瀟で、耇数のAIの開発プロゞェクトにおいお掻甚されおいる。あるプロゞェクトでは、数癟人の手曞き文字の収集ずデヌタ加工の正解率を28.7向䞊させたずいう。

なお同サヌビスの提䟛に際しお、初期導入費甚や固定管理費などはかからず、基本的に1ラベルに぀き7円で提䟛するずいう。䟋えば、1枚に぀き50ラベル存圚する画像1䞇枚分のアノテヌションで350䞇円ずいった具合だ。

同瀟は今埌、AIを掻甚した新しい機胜の実装や、さたざたなパヌトナヌ䌁業ずのデヌタ連携などを怜蚎しおいく考えだ。