【レポート】

ビッグデータ分析でのビジネス価値創出を体感--ビッグデータセミナー原沢氏

河原潤  [2012/07/25]

「ビッグデータの分析は敷居が高い」「わが社にはビッグデータと呼べるほど大量のデータを扱わない」といった声は少なくないが、名だたる企業による"先進事例"ばかりがビッグデータ活用ではない。

「ビッグデータ分析プラットフォーム・セミナー」(マイナビ主催)のセッションに登壇した日本IBM ソフトウェア事業 インフォメーション・マネジメント事業部 Big data/DWH/Netezza Technical Sales部長の原沢滋氏は、IBMのビッグデータ・ソリューションを用いた身近なビジネス・シナリオを実演し、来場者に活用していくうえでのヒントを提示した。



「だれでもできる」ビッグデータ分析を実演

日本IBM ソフトウェア事業 インフォメーション・マネジメント事業部 Big data/DWH/Netezza Technical Sales部長 原沢滋氏

「前の4つのセッションでIBMのビッグデータ・ソリューションをそれぞれ紹介してきたが、最も重要なことは、ビッグデータ分析をどうビジネスに生かせるかである」。冒頭、原沢氏はこう述べた後、業務で扱うデータが氾濫していく中で競合他社との差別化の観点から自社のビジネスを伸ばしていくカギとなるのがまさにビッグデータであるとした。

IBMは、Hadoopディストリビューションの「IBM InfoSphere BigInsights」、DWHアプライアンスの「IBM Netezzaアプライアンス」、ストリーム・コンピューティングの「InfoSphere Streams」という、アプローチの異なる3製品をビッグデータ・ソリューションとして提供している。いずれも、ビッグデータの特性を示す、量(Volume)・種類(Variety)・速度および生成頻度(Velocity)の"3つのV"に基づいて設計・開発されており、ユーザー企業は自社で扱うデータの特性に応じてソリューションを選択することができる。

原沢氏は、ビッグデータ活用に着手するにあたっては、「まず、企業で扱うさまざまな種類のデータのうち、どのデータを活用すればビジネスになるか、収益を上げることができるのかをしっかりと見極める必要がある」として、身近なビジネス・シナリオを題材に、各ソリューションの特徴・機能を示すデモを行った。

設定されたグランドシナリオは、あるコンビニエンスストアでの売上げをいかに拡大していくかというもの。過去2年分の店舗での売上データを分析した結果、おにぎりが朝の10時までに約30個売れた場合、売り切れとなって機会損失が出ることが判明している。最初のデモでは、この結果を基に、ストリーム・コンピューティングによって、より正確な予測を行って入荷を最適化していくさまが示された。

POSレジでの売上げは、流れているデータ、すなわちストリーミング・データである。これに対してStreamsに「朝10時までにおにぎりを30個販売」という達成値を自動でモニタリングさせてアラートを発するように設定。店長はPDAでStreamsからのアラートを受け取ったらただちに追加注文を行うことで、別の業務で忙殺されていても機会損失を逃すことがなくなる。

「ビッグデータを実際のビジネスにつなげるためには、だれでも簡単に使えることが何より重要となる」と原沢氏は述べ、デモのシステムがいかに簡単に構築できるかを示すため、Streamsの管理画面をスライドに映した。以下の画面にあるように、このデモで実行されるフローはわずか6つの単純なステップで構成されている。

コンビニでのおにぎり販売を最適化するシナリオを、IBM InfoSphere Streamsを用いて実現するデモの画面

表計算ソフトのようなGUIで行う、非構造化データの分析

次に行われたのはBigInsightsのデモだ。原沢氏はBigInsightsの管理画面をスライドに映しながら、分析処理のためのマシンを簡単に追加して設定できることを示し、Streamsと同様、分析モデルの構築が容易に行えることがアピールされた。

「オープンソース・ソフトウェアを扱ううえでユーザーにとって障壁、負担となるのがプログラミング作業だが、BigInsightsに備わるGUIがそれを緩和してくれる」と原沢氏は述べ、Hadoop/MapReduceベースで構築されたBigInsightsのデータに対して、表計算ソフトのような操作で分析を行えるGUIツール「BigSheets」を紹介。BigSheetsを使って、Twitter上でのコンビニ商品に関するツイート(つぶやき)を収集し、ツイートの内容がポジティブなのかネガティブなのかをテキスト・マイニングにかける分析を実演してみせた。

BigSheetsでは、表計算ソフトのようなGUIで分析を行える。画面はコンビニ商品に関するツイートを収集し、ツイートの内容にテキスト・マイニング分析を行っているところ

非構造化データと構造化データの結合分析で「これまで発見できなかった洞察」を得る

セッションの最後に行われたのが、Netezzaおよび統計解析ソフトの「IBM SPSS」の機能を紹介するデモだ。ここでのシナリオは、時系列の販売状況(ストリーム・データ)、コンビニ商品に対するTwitterでのポジティブ/ネガティブな反応(非構造化データ)、社内のRDBMS/DWHに蓄積された売上データ(構造化データ)を組み合わせて分析することで、これまで発見できなかった洞察を得るというもの。

「インターネット経由で外部から収集したデータそのものから、ビジネス的な価値を生み出すことは非常に難しい。社内に蓄積されたデータと比較してはじめて、競争優位につながる有用な価値を生み出せるようになる」(原沢氏)

Netezzaには、テラバイト(TB)クラスの構造化データが格納されており、SPSSとの連携で、あらかじめ1カ月分の売上データを自動集計する仕組みが構築されている。そこに、Streamsで処理しているストリーム・データと、BigInsightsで処理している非構造化データとを連携させる。前のデモで示されたのと同じように、StreamsとBigInsightsにおけるレコード集計は、Netezza上でも簡単なステップで行うことができる。

こうして各分析ソリューションとデータの連携がなされた状態で、原沢氏は、Twitterでの反応のうち、ポジティブ反応だけを抽出したデータと実際の売上データを結合し、比較を行った。そして、SPSSからレポートされた結果からは、両者には非常に強い相関関係があることが示された。

「分析の結果からどんなアクションを起こすべきか。まずは、Twitterで評判がよいのにもかかわらず実際にはあまり売れていない商品について、そうなった理由を探ることが考えられる。例えば、商品棚の陳列方法がよくないといった理由が判明することになり、次にとるべきアクションが決まってくる」と原沢氏。最後に来場者に向かって、「まずは、ビッグデータ分析がもたらす効果を体感していただきたい。皆さんのビジネスがいかに変革されていくか、きっとご理解いただけるはずだ」と語りかけた。

「ビッグデータ分析プラットフォーム・セミナー」総力レポート!!

『ビッグデータ分析プラットフォーム・セミナー』
講演資料、無料ダウンロード提供中!!


6月19日に開催した『ビッグデータ分析プラットフォーム・セミナー』における各セッションの講演資料を無料でダウンロード提供しております。

ご希望の方はこちらのWebサイトにてお申込みください。

なお、ダウンロードには個人情報の入力が必要になりますが、メールの署名などのテキストデータをコピー&ペーストするだけで各項目が自動入力される「かんたん入力」機能もご用意しております。入力作業がわずか数秒で終わる便利な機能ですので、ぜひともご活用ください。

⇒講演資料ダウンロードページ

    関連したタグ

    新着記事

    求人情報

    人気記事

    一覧

    イチオシ記事

    新着記事

    転職ノウハウ

    あなたの仕事適性診断

    4つの診断で、自分の適性を見つめなおそう!

    Heroes File ~挑戦者たち~

    働くこと・挑戦し続けることへの思いを綴ったインタビュー

    はじめての転職診断

    あなたにピッタリのアドバイスを読むことができます。

    転職Q&A

    転職に必要な情報が収集できます

    スカウト転職する

    企業からアプローチのメッセージが届きます。