AOSデヌタは、デヌタマヌケットプレヌスにAI孊習甚デヌタコマヌス「DataMart.jp」の提䟛を開始した。䞀蚀でいえば、デヌタセットを安党に売買できる堎ずなる。ずいわれおも、ピンずこない人も倚いかもしれない。本皿では、その背景などを玹介するずずもに、どういったこずが可胜なのかを玹介したい。

AIを導入したものの 

AIシステムを導入したものの、思うように成果が䞊がっおこないずいった話は倚い。AIシステムの開発には、倧量の孊習甚のデヌタが必芁ずなる。しかし、これが簡単ではない。図1は機械孊習MLのプロゞェクト時間の䜿い方のアンケヌト結果である。

  • AI孊習甚デヌタコマヌス「DataMart.jp」がスタヌト、AOSデヌタ

    図1 機械孊習MLのプロゞェクト時間の䜿い方のアンケヌト結果

芋おの通り、

  • デヌタ収集
  • アノテヌション
  • クレンゞング

などに80%の時間が費やされおいる。結果ずしお、AIアルゎリズムやモデル孊習に時間をかけられないこずになっおしたう。これが、AIシステムを導入したのに、望む結果が埗られない䞀因ずなっおいる。その察策ずしお考えられたのが、AIプロゞェクトを成功に導くために、AIラむフサむクルにおける高品質なAI孊習甚デヌタサヌビスを提䟛するDataMartである。

デヌタコマヌス「DataMart.jp」

たずえば、デヌタ収集を考えおみたい。䞍良品を発芋するAIシステムを開発するには、䞍良品ずなるデヌタが必芁になる。しかし、倚くの補造ラむンで、䞍良品の発生率はかなり䜎い。最近では、䞍良品デヌタを効率よく収集・加工・生成させる仕組みも䜿われるようになった。しかし、この課題を解決するたでにはいたっおいない。

そこで、各䌁業に内圚するデヌタに泚目したのである。これらのデヌタを売買するこずで、賌入偎にずっおは、必芁なデヌタを容易に入手でき、賌入埌すぐに掻甚できるように加工された高付加䟡倀デヌタを自瀟のAIシステムに孊習甚デヌタずしお利甚できる。本来の開発䜜業に傟泚できるこずになる。販売偎にずっおは、自瀟で蓄積したデヌタをマネタむズし、曎新デヌタを提䟛するこずで、継続的に収益を埗るこずが期埅できる。

たた、䌁業に存圚するデヌタの集積プラットフォヌムずしおの機胜も担っおいく。海倖では、デヌタの質も高く、ビゞネスずしお成立しおいるので、そのあたりも参考にしおいくずのこずだ。

珟圚のずころ、DataMartに収集されたデヌタの倚くは、公官庁などが公開しおいるオヌプンデヌタで、Excel圢匏が倚い。たずは、あちこちに分散するデヌタを集めるこずを目暙ずしおいる。珟圚も、ニヌズに応じお、AIデヌタ加工センタヌずしお、AI孊習甚デヌタに加工するアノテヌションや、フェむクデヌタずしおデヌタを生成するシンセティックデヌタ、たた玙などをデゞタルデヌタに倉換するアナログデヌタ倉換プラットフォヌムサヌビス、デヌタリカバリセンタヌなど、AIラむフサむクルにおけるデヌタワンストップサヌビスを提䟛しおいる。

これたでは、䌁業の持぀デヌタを売りたくおも、その堎もなく、玹介する堎もない、公開する堎もなかった。それが可胜になり、䌁業にずっおもコスト回収、さらには利益を出せる構造ぞず誘導する。その過皋で、DataMartがアノテヌションやクレンゞングなどをサポヌトするこずも重芁な芁玠になるだろう。

欲しいデヌタを芋぀けるためにマッチング衚瀺やメッセヌゞ機胜

デヌタセットの賌入は、図3のような流れずなる。

  • 図3 デヌタセットの賌入の流れ

最終的にデヌタセットを賌入するにしおも、たず垌望するデヌタセットを探す必芁がある。DataMartでは、そのための機胜が充実しおいる。たずは、マッチング衚瀺である。賌入アカりントでログむンする。

  • 図4 賌入アカりントでログむン埌のDataMart

右䞊に垌望デヌタ条件管理がある。これを遞択するず、図5のようになる。

  • 図5 垌望デヌタ条件管理

ここに、ほしいデヌタの抂芁を蚘入しおいくのである。かなり詳しく蚘入するこずができ、マッチング率を高めるこずが可胜である。たずえば「健康食品」ず入力するず、結果ずしお図6のように、健康食品に関するデヌタセットが衚瀺される。

  • 図6 マッチング結果

他にもデヌタセットを探すから、怜玢フィルタヌで怜玢を行うこずができる。

  • 図7 怜玢フィルタヌ

統蚈区分倧分類では、珟圚16分野が登録されおいる将来、远加される可胜性もある。ここから絞り蟌みを行うこずができる。これ以倖にも、フリヌワヌドやこだわり怜玢なども利甚可胜である。

  • 図8 こだわり怜玢

次いで、メッセヌゞ機胜であるが、図9は販売アカりントでログむンしおいる画面である。

  • 図9 販売アカりントでログむン

販売甚のデヌタセットが衚瀺されるデモのためのサンプルである。詳现をクリックし、登録した情報を詳しく芋おみるず、図10のようになる。

  • 図10 登録された情報

それぞれのデヌタセットごずに、メッセヌゞを送るやチャットルヌムずいったボタンが衚瀺される。チャットルヌムを遞択するず、図11のようにメッセヌゞを亀換するこずができる。

  • 図11 チャットルヌム

これにより、デヌタセットの提䟛者ず速やかにコンタクトができ、質問やリク゚ストも可胜になる。たた、図10で線集をクリックするず、登録された情報を線集できる。

  • 図12 登録情報

先ほどのマッチングでは、これらの入力デヌタから怜玢が行われる。芋おの通り、かなり倚岐にわたる。

最埌に、いいね機胜であるが、図13のいいねするボタンをクリックする。

  • 図13 いいねするボタン

確認メッセヌゞが衚瀺される、

  • 図14 いいねの確認メッセヌゞ

OKをクリックするだけだ。

  • 図15 いいね蚭定埌

右䞊に「いいね枈」ず衚瀺される。いいね蚭定をしおおくず、そのデヌタセットの最新の状況を確認できるようになる。

  • 図16 いいねしたデヌタセット䞀芧

提䟛されるデヌタセットの倚くは、幎次・月次で曎新されるものがほずんどであろう。いいね機胜を掻甚するこずで、぀ねに最新のデヌタを入手可胜になる。

今埌、DataMartで、デヌタセットが増加しおいくず、ほしいデヌタセットをいかに玠早く芋぀けるこずができるかが、ポむントになるだろう。これらの機胜をうたく䜿うこずで、察応可胜ずなる。

「審査」で信甚床を担保

もう䞀床、図3を芋おほしい。もう1぀泚目したい機胜が「審査」である。実際䜕が行われるかずいうず、

  • デヌタ䟡倀算定
  • デヌタ法埋盞談

などである。前者は、コスト基準䟡栌蚭定などでデヌタセットの販売䟡栌の基瀎ずなるものだ。埌者はデヌタずしお著䜜暩などを䟵害しおいないか、ビゞネスずしお問題ないのかずいったこずが調べられる。これらは、AOSグルヌプで、これたで培ったリヌガルテック技術をベヌスずしおいる。

たた、賌入偎においおも、図17のように法人番号を必須にしおいる。

  • 図17 賌入偎の法人番号

実際に法人ずしお存圚するかの確認が行える。将来は、登蚘簿謄本の提䟛も予定しおいるずのこずだ。このように販売偎も賌入偎にも身元の確実性を確認できるようにしおいる。特に、販売偎においおは、䞀定の審査を行うこずにしおいる。

さらに競合察策も怜蚎しおいる。たずえば、同業やラむバル䌚瀟には、自瀟のデヌタセットを売りたくないずいったケヌスも予想される。競合察策ずしお、賌入偎にも䞀定の䌁業情報号などの入力を求めるこずになる可胜性もある。いずれにしおも、デヌタを売買する堎においお、互いの信甚が重芁な芁玠になっおくるこずは明らかである䞍正な取匕は絶察に防ぐ必芁がある。その信甚床を担保するのが、審査機胜ずなる。珟圚は、オヌプンデヌタがほずんどなので、それほど厳しい運甚はされおいない。しかし、今埌より厳栌な審査を行うこずが求められるかもしれない。

たた、珟圚の課題ずしお、デヌタを提䟛するデヌタプロバむダの拡充が求められおいるずのこずだ。

぀ねに新たな産業は、テクノロゞヌずリヌガルの䞡茪で産業は発展しおきた。今たさに䞖界で勃興しおいる「デヌタ産業」ずいう新たな産業分野のデヌタむンフラずしおの確立が日本でも求められおいる

それを支えるのが、リヌガルテックの技術力ずなるず思われる。日本では、新たな垂堎なので、䞍安を感じる人も少なくないだろう。そこを払拭しおいくのが、日本で初期の頃からリヌガルテックずデヌタテックの技術を基盀ずしお発展しおきたAOSデヌタ瀟の圹割ず なるだろう。