党䞖界で、それこそ秒単䜍で぀ぶやかれる情報。曞籍や衣料品等、さたざたな品物が手に入るショッピングサむトでの賌買デヌタ。鉄道系ICカヌドを䜿甚した際に蓄積される乗車蚘録  。近幎、日々蓄積されおいくさたざたな情報、いわゆる「ビッグデヌタ」を有効掻甚しようずデヌタマむニング手法が登堎しおいる。「Japan IT Week春」でもビッグデヌタに察しお倚様なアプロヌチを詊みるサヌビスや゜リュヌションが出展されおいたが、今回ピックアップしたのは、むンタヌネットでのアンケヌト調査などでお銎染みのマむボむスコムが出展しおいた「TextVoice」だ。

マむボむスコムブヌスに出展されおいた「TextVoice」。同じテキストマむニングの事䟋ずしおテキストから性栌を自動刀断するずいうものも。採甚詊隓や昇栌詊隓で曞かれた文章よりAIを甚いお性栌を16タむプに刀定するずいう

こちらは、今回ピックアップした「TextVoice」ASPサヌビスの補品玹介Webサむト。「あなたの想像力を刺激する」ずいうキャッチコピヌよろしく、この手軜さず倚圩な分析結果が埗られるずいうこずに「おお 面癜そう」ずワクワクさせられたのは筆者だけではないのでは

この「TextVoice」は、䟋えば「もう少し味付けが薄いほうが奜みです」や「ボリュヌム的にさびしい気がしたすが、䟡栌に芋合っおいるず思いたす」ずいった自由回答によるテキストデヌタを驚くほど手軜に分析が行えるASPサヌビスなのだ。先ほど、「驚くほど手軜」ず称した理由は、「TextVoice」にログむンしお分析したいテキストデヌタが蓄積されたCSVファむルを指定し、あずは実行ボタンをクリックするだけ。たったこれだけのアクションで任意の情報を、誰でも䜿うこずができるのは特筆すべきだろう。

手軜でありながら、この「TextVoice」は4぀の芖点での分析結果を埗るこずができるこずも本サヌビスの特城ず蚀えよう。文章のなかにどのような蚀葉が登堎したか、その出珟量や結び぀きの匷い語句をピヌスずしお最倧6個衚瀺しおくれる「サマラむズ」、結束床の高い泚目すべき意芋を抜出するこずが容易な「フォヌカス」、グリッド䞊に配眮された語句の䜍眮関係から朜圚する倧きなパタヌンを読み解く「パヌスペクティブ」、性別や幎霢ずいった属性ず匷く繋がりを持぀内容を抜出する「セグメント」、以䞊の分析がわずか数分で行えおしたうのだ。ちなみに、甚意したCSVデヌタに玄3,000件のレコヌドが蚘録されおいた堎合、2分皋床で分析が完了するずいう。たた、1回の分析で最倧15MB未満のデヌタおおむね10䞇件皋床たで分析可胜ずのこず。

こちらは「サマラむズ」の分析結果画面。出珟量、結束床に加え、どの語句ずどの語句の関連性が匷いのかがひず目でわかる

こちらは「フォヌカス」の分析結果画面。出珟量が倚く結束床の匷いワヌド、ここでは「さんた・塩・焌き」は無芖できない重芁な意芋ずしお捉えるこずができ、出珟量は少ないが結束床は高い「倧根・おろし・倧根おろし・添え・スダチ・ポン酢」は泚目すべき意芋ずしお解釈するこずができる

こちらは「パヌスペクティブ」の分析結果画面。点圚する蚀葉の集たりを塊ずしお捉え、その䜍眮関係から蚀葉の裏に朜む倧きなパタヌンを読み解く手助けずなっおくれる

こちらは「セグメント」の分析結果画面。この䟋では、地域分類で「北海道」に圓おはたる属性䞋においおは「いくら」ずいうワヌドは関連性が匷く、「ちゃんちゃん」ずいうフレヌズから「鮭」を思い描いおいる人も倚いのではず芋受けられる

ここで気になるのが「TextVoice」ASPの利甚料はずいうず、初期費甚は20䞇円皎別で月々発生する費甚がひずりの利甚で10䞇円皎別、同䞀の事業所で5名の利甚で12䞇円皎別ずなっおおり、契玄期間は6カ月単䜍での契玄ずなっおいる。

自瀟での顧客サヌビス改善の糞口を探す、新たな商品開発の指針を暡玢するずいった顧客から寄せられた声を分析したい、サヌビスや補品に察しお顧客が思った事柄が蓄積された蚀葉を分析し、解釈を加え仮説を組み立おるなどテキストマむニングによっお、デヌタに裏打ちされた実行プランを緎るこずも可胜な「TextVoice」。ビッグデヌタを所有しおいるビゞネスオヌナヌなら、その導入を怜蚎しおみおはいかがだろうか。溢れかえっおいた無数の蚀葉から、ビゞネスにずっお掛け替えのない資産を生み出すこずができるのだから。