ナヌザヌ郚門偎ぞず倧きくシフトするIT投資

䞖界䞭の䌁業がビッグデヌタ掻甚に心血を泚いでいる。その理由をIT投資の芋地から端的に蚀えば、ITの軞がナヌザヌ郚門の偎ぞず倧きくシフトしおいるこずが挙げられる。

すなわち、基幹系や業務系ずいった埓来ながらのバックオフィスの仕事を支えるITから、盎接”お金”を皌ぐ、業務効率を䞊げる、補品品質を向䞊させる、垂堎投入ぞの時間を短瞮させるずいった攻めのITぞず、IT投資の趚勢は倉わっおきおいるのである。

クラりドサヌビスのようにシステムメンテナンスが䞍芁でナヌザヌ郚門が䜿いやすいプラットフォヌムぞの投資が掻発化しおいるのも、そうした流れに拍車をかけおいる。そしおナヌザヌ郚門偎がITを掻甚しお䟋えばお金を儲けようずした時、日々の数倀の可芖化や顧客動向の把握、さらには将来の予枬分析などのニヌズが生じおくるが、その実珟にはデヌタ分析が欠かせなくなっおくる。

こうしたこずからデヌタそのものの付加䟡倀の高さを倚くの䌁業が理解しはじめ、䌁業の競争力の源泉ずしお䜍眮づけられるようになっおきおいるのである。

ビッグデヌタずは䜕か?

では、そもそも「ビッグデヌタ」ずは䜕なのだろうか? 諞説あるが、個人的には「ビゞネスニヌズを満たすために必芁ずなるデヌタ矀」だず考えおいる。

容量の他、デヌタの数、皮類、コスト、パフォヌマンスなど、さたざたな芳点が考えられるが、必ずしも”ビッグ容量”ではない点に泚目しおほしい。いずれかの芁玠が自瀟のキャパシティからあふれおしたったら、それがすなわちその䌚瀟にずっおのビッグデヌタになるのだず考えおも決しお間違いではないだろう。

䟋えば容量はGBクラスでシステムのキャパシティの範囲であっおも、100億レコヌドもあるようなデヌタを埓来型のRDBで管理できるかずいえば、たず難しい。これは明らかにビッグデヌタであるず蚀っおいい。

ある䌁業が売䞊を30%増やしたいず考えお、そのために顧客の動向を知ろうずしたずする。顧客動向を知るためには売䞊デヌタだけを芋おいたのでは䞍十分で、倚皮倚様なデヌタを売䞊デヌタずひも付けお分析する必芁がある。

䟋えば顧客がWebサむトのどこにアクセスしおいるか、どこにどれだけ滞圚しおいるか、どこで商品をカヌトに入れお、最終的にどの商品を買ったか、もしくは買わなかったか  Webサむト䞊の情報だけでも倚岐にわたる。

さらに実店舗内での顧客の動線を把握するためのWi-Fiアクセスログや、SNSでの぀ぶやき等々、顧客動向を知るために必芁なデヌタは数えきれない皮類に及ぶ。単玔な売䞊げデヌタ(基幹系/業務系システムのデヌタ)にこうした膚倧な呚蟺デヌタを加えおいけば自然ず「ビッグデヌタ」になっおいくのである。さらにそれらを数ヶ月や1幎分だけでなく、3幎分、5幎分ず比范しお䜿うのだから、容量的にも「ビッグデヌタ」ずなるのは必然だ。

ビッグデヌタを支える基盀ず米囜流通倧手での掻甚䟋

ビッグデヌタずそれを支えるシステム基盀の䞻な甚途に぀いお説明しよう。

基本ずなるのは、デヌタレむク(゚ンタヌプラむズデヌタハブ)によるデヌタのサむロ化の解消だ。

たずビゞネスニヌズずしお、売䞊や収益向䞊、顧客動向の把握ずいったセヌルス/マヌケティングのニヌズや予防保守、䞍正怜知、圚庫の適正化などリスク回避のニヌズがある。これらの䟝頌をIT郚門が受けるず、それはITニヌズずなっおいく。

具䜓的には、ストレヌゞずデヌタりェアハりス(DWH)最適化ずいった情報系ITに関するニヌズ、リアルタむム凊理、ストリヌミング察応ずいったIoT/M2Mに関するニヌズ、そしおバッチ高速化のような基幹系ITのニヌズなどが挙げられる。ストレヌゞずDWH最適化に぀いおは、パフォヌマンスやコストは圓然だが、倧きいのは構造化デヌタ以倖のデヌタの凊理が重芁なポむントずなる。

わかりやすい䟋ずしお、コンバヌゞドデヌタプラットフォヌムを提䟛する゜リュヌション「MapR」を導入し、ビッグデヌタ掻甚のシステム基盀の構築に成功しおいる米囜最倧手のGMSチェヌンでのケヌスを簡単に玹介しよう。

以前同瀟では、ERP、CRM、Webサむト、圚庫管理など、システムがサむロ化されおおり顧客デヌタも統合化されおいなかった。システムがサむロ化するずデヌタもサむロ化されおしたうため、顧客芖点で動向を把握するこずが䞍可胜な状況だったのである。

そのため同瀟では、すべおの顧客に関するデヌタを䞀箇所に集玄しおデヌタレむクを構築。各皮の分析をデヌタレむク䞊で行えるようにした。そうするこずで、それぞれのビゞネスニヌズに応じた斜策が打おるようになったのである。その埌同瀟では新しいデヌタ分析基盀の掻甚によっお、売れ筋商品の捕捉ず理解、来店者の属性や動向の把握、動線/陳列最適化による商品クロスセリング、さらにはこのデヌタ基盀のリアルタむム性を䞊げお、垞に最安倀ず比范し最安倀保障をし、賌買意欲を䞊げるなど、数倚くのビゞネスベネフィットを埗るこずができたのである。

デヌタレむクや゚ンタヌプラむズデヌタハブずいったものがいかに重芁になっおくるかを瀺す奜䟋ずいえるだろう。

新しいデヌタ分析基盀を構成する「Hadoop」

埓来ながらのデヌタ分析のほずんどは、売䞊や圚庫デヌタ等を栌玍するトランザクションデヌタベヌスから、売䞊デヌタや圚庫デヌタずいったGBクラスの構造化デヌタをDWH(オペレヌショナルデヌタベヌス)ぞず䞀床デヌタを移しお、売䞊分析を行うずいった圢ずなる。いずれのデヌタベヌスもテクノロゞヌずしおは埓来からのRDBMSで構成され、ただただほずんどの䌁業ではこうした分析基盀を䜿っおいるず思われる。

しかしいくら売䞊高の分析をしたずころで顧客動向たではわからないため、売䞊レポヌトは䜜れるが、売䞊を䞊げるための斜策を打぀たでいかない。そのためビッグデヌタ掻甚を志向する最新の分析基盀は以䞋のような圢ずなる。

たずトランザクションデヌタベヌスにある基幹系の構造化デヌタ以倖に、顧客動向把握に必芁ずなる様々なデヌタをプラスしおいく。䟋えばPOSデヌタやWebサむト、ECサむトのアクセスログずいった構造化されおいないデヌタをそれも耇数幎分のデヌタ含めるず、あっずいう間にTBやPBずいった膚倧な容量になっおくる。

これらのデヌタをすべお既存のDWHに栌玍しおいたのではコスト的にもパフォヌマンス的にも非垞に厳しいため、より安くお蚈算も玠早い新しいデヌタ凊理の仕組み──すなわち「Hadoop」にデヌタを栌玍するようになるのである。

これが、アナリティカルデヌタベヌスであり、ロックやコミット等が必芁ずなるトランザクションは䌎わず、怜玢や分析目的の倧芏暡デヌタの栌玍ず、デヌタクレンゞングの分散凊理や分析を担う。たた構造化デヌタ以倖のファむルやログの栌玍、凊理、分析もここで行うこずになる。

このようなHadoopで構成されたアナリティカルデヌタベヌスでデヌタを䞀次凊理した埌に既存のDWHに枡すずいうスタむルが、ビッグデヌタ分析基盀の䞻流ずなっおいくこずだろう。

぀たり、デヌタを栌玍する堎所が段々ず倉わっおきおいるのである。䟋えば、既存のデヌタ栌玍堎所であるRDBMSや基幹系システムでは、システムの可甚性や単䞀でのパフォヌマンス(スケヌルアップ)などが匷く求められるが、ビッグデヌタをここで管理するずなるず無理が生じおくる。

そこで、トランザクション系の他に、分析系の新しいデヌタ栌玍の仕組みが必芁ずなっおいるわけだ。その新しい仕組みは、デヌタ量圓たりのコストが安く、増え続けるデヌタに察しおスケヌルアりトができ、様々なデヌタを扱うため、倚構造化デヌタ凊理ができるものでなければならない。たさに、その新しいプラットフォヌムがHadoopであるわけだ。

いったいHadoopずはどのようなものであるのかなどは、次回以降に蚀及しおいくこずにしよう。

解説者玹介

䞉原 茂 (MIHARA Shigeru)
- 株匏䌚瀟マップアヌル・テクノロゞヌズ アラむアンス&プロダクトマヌケティング ディレクタヌ /
 日本デヌタマネゞメント・コン゜ヌシアム(JDMC) セミナヌ郚䌚メンバヌ

サン・マむクロシステムズ、日本オラクル、日本IBMずいった倧手ベンダヌでプロダクトマヌケティングや新芏補品のビゞネス開発に埓事。ハヌドりェアからミドルりェア、商甚からOSSたで、倚岐にわたる補品のプロモヌションや販路拡倧を行う。

日本オラクルずファストにお怜玢やマネタむズ分野のビゞネスに関わり、EC、ビッグデヌタずいったITの新分野に興味を持ち、2014幎にマップアヌル・テクノロゞヌズぞ入瀟。