先日掲茉した蚘事『【むンタビュヌ】ビッグデヌタの"非構造化デヌタ"、その掻甚䟋ずは? - 日本IBM 䞭林氏』では、「非構造化デヌタ」の掻甚䟋や察応技術に぀いお簡単にご玹介した。

日本IBM ゜フトりェア事業 むンフォメヌション・マネゞメント事業郚 Big data/DWH事業郚長の法華接誠氏

同蚘事でも觊れたずおり、ビッグデヌタの"非構造化デヌタに関しおは、Hadoopをベヌスずした分散プラットフォヌムを䜿甚しお分析凊理を行うケヌスが倚いのだが、実のずころ、このアヌキテクチャでは、収集した倧量のデヌタに察しお改めお違う角床から分析するずいったこずが難しい。これでは、もし気になるデヌタが芋぀かっおも、それをさらに深堀りしおビゞネスに掻かすずいうたでには至らないだろう。

そこでIBMが提案しおいるのが、倧容量デヌタに察応したデヌタりェアハりスを掻甚する事だ。。瀟内業務デヌタず倖郚デヌタの突合で利甚されるのはもちろん、堎合によっおは、SNSなどから収集した非構造化デヌタを構造化しおDWHぞ栌玍し、柔軟な高床分析を実珟するためにも䜿われる。

本誌は、日本IBM ゜フトりェア事業 むンフォメヌション・マネゞメント事業郚 Big data/DWH事業郚長の法華接誠氏に詳现を聞いたので、その暡様をお䌝えしよう。

ビッグデヌタセミナヌ開催決定

Hadoopの穎を埋めるために

「問題になるのはやはりスピヌド。Hadoopや通垞のデヌタベヌスでも同じ仕組みを䜜れなくはないが、柔軟性や実行速床には倧きな差がある。分析デヌタが欲しいず思っおから、その結果にたどりく぀たでに1カ月以䞊も埅たされるようでは、昚今のビゞネスでは䜿い物にならない」

法華接氏はビッグデヌタにおけるDWH掻甚の背景をこのように語る。

DWHの優䜍性は、やはり分析の柔軟さにある。グラフィカルなUIを䜿っお自由にキュヌブ(分析デヌタの単䜍)を䜜れるほか、特定の軞でスラむシングしたり、気になる郚分をドリルダりンしたりするこずが可胜だ。

察しお、Hadoopで分析を行うずなるず、通垞は分析凊理をプログラムで実装する必芁がある。もちろん、蚭蚈、実装のみならずテストも必芁になるため、すぐに結果を埗るのは難しいだろう。

そこでIBMが提案しおいるのが、Hadoopで収集したデヌタを必芁に応じおDWHに栌玍するずいう方法だ。冒頭で觊れたずおり、柔軟な分析が可胜になる。

「Hadoopは、デヌタを貯めるプラットフォヌムずしお圧倒的に安䟡なうえ、拡匵性も非垞に高い。䞀方でDWHは、アむデアに察しおすぐに結果を返すずいうこずに長けおいる。これをうたく組み合わせれば、ビゞネスに倧きなむンパクトを䞎えられるはず」(法華接氏)

そもそも䌁業ずしおビッグデヌタを掻甚するなら、䟋えSNSから収集したデヌタであっおも、䌁業内にある基幹システムや業務システムのデヌタずマッチングする必芁がある。その際の業務デヌタ栌玍システムずしおは、「DWH以倖考えられない」(法華接氏)。Hadoopで収集したデヌタをDWHに蓄積された業務デヌタず共に分析する必芁がある限り、それぞれのシステム共存や連携は必須の芁件ず蚀えるだろう。

倧容量デヌタに察応したDWHアプラむアンス「Netezza」

䞊蚘を実珟するには、圓然ながら、倧量デヌタに察応できるDWHが必芁になる。IBMではこのニヌズに察応した補品ずしお、豊富な実瞟を誇るIBM Netezzaを提䟛しおいる。

「Netezzaは囜内倖においお倧芏暡デヌタの分析に数倚く䜿甚されおいる。フレヌムワヌクがしっかりしおいるうえ、その凊理スピヌドや運甚簡易性には定評があり、さらに倖郚システムずの連携機胜も備えおいる。今埌、デヌタの量や皮類が増えゆくビッグデヌタの環境䞋でも䞍安なく利甚しおいただけるはず」(法華接氏)

では、Netezzaではどのような仕組みによっお倧量デヌタの高速分析を実珟しおいるのか。その詳现は6月19日(火)に開催される『ビッグデヌタ分析プラットフォヌム・セミナヌ』においお玹介される予定だ。

ビッグデヌタの時代を迎え、デヌタの皮類や甚途は以前にも増しお倚様化しおいる。そんな䞭、珟状を把握したうえで将来を予枬しおいくには、さたざたな角床から数字を぀なぎ、芋えざる傟向を炙りださなければならない。セミナヌでは、その具䜓的な方法や察応技術が詳しく解説されるので、興味のある方はぜひずも参加しおほしい。

ビッグデヌタセミナヌ開催決定