12月9日、マイナビニュースが、データ活用をテーマに据えたイベント「マイナビニュースフォーラム2014 Winter for データ活用」を秋葉原UDXにて開催する。このイベントでは、実店舗、ECサイト、さらにはプロ野球における選手の行動パターンまで、さまざまな分野の第一線で活躍するデータ活用のプロが、講演者として招へいされているほか、数多くのセッションを予定している。各社各様の取り組みの中から、必ず現場で役立つノウハウが得られるはずだ。

マイナビニュース フォーラム 2014 Winter for データ活用」の参加申し込みはこちら(参加費無料、12月9日(火)開催、東京都千代田区、開場9:30~)

その中から「データ活用に必要なDMPはこう作る!」と題したセッションを行う、東京エレクトロン デバイス株式会社 コーポレートアカウント営業部 住友義典氏に、イベントに先立って話を聞いた。

近年、DMP(データ・マネジメント・プラットフォーム)というキーワードに注目が集まっているが、DMPの実現にはさまざまなアプローチがある。東京エレクトロンデバイスでは「データレイク構想」に基づき、「EMC Isilon」と「Pivotal HD」の組み合わせによりDMPを実現する。

注目が集まるDMPとは?

DMPとは言葉どおり、データを管理するためのプラットフォームだが、その概念は二つに分けられる。一つは、さまざまなデータを分析して顧客に最適な広告を配信することであり、もう一つは、大量のデータを分析してより広いマーケティング分野で活用するという意味だ。

東京エレクトロン デバイス株式会社 CN営業本部 コーポレートアカウント営業部 住友義典氏

東京エレクトロンデバイス(以下、TED)が提唱するDMPは、後者の意味である。住友氏は「DMP自体は、シンプルにデータを管理する仕組みですが、自分たちで収集したデータだけでなく、第三者のものも含めてデータを分析し、新たなサービスを創出することを意味しています」と語る。

しかし、企業システムに分散され保存されているデータをシンプルに一元管理することは、それほど容易なことではない。そこでTEDが推進するのが「データレイク構想」である。データレイクとは、一つのデータの湖を作り、企業内に散在しているデータをその湖に統合し、一元管理を実現する構想だ。同社は、このデータレイク構想に基づいてDMPを実現するという。

データレイク構想によるDMPの実現

TEDでは、EMC社のスケールアウト型NAS(ネットワーク・アタッチド・ストレージ)製品「EMC Isilon」(以下、Isilon)と、Pivotal社のエンタープライズHadoopソリューション「Pivotal HD」の組み合わせでDMPを実現する。住友氏は「導入しやすさが特長で、組み合わせた導入はもちろん、どちらかの製品から始める段階的な導入もできます」と語る。

Isilonの最大の特長は、スモールスタートで導入し、データ量の増大に合わせてスケールアウトで拡張できること。またサイジングを行い、モデルを決めれば、導入から稼働まで1カ月弱で実現できる、シンプルな構成も特長の一つだ。ストレージ製品を導入する感覚で、ビッグデータ分析のためのインフラを構築することができる。

一方、Pivotal HDは、SQLインタフェース「HAWQ」を活用することで、SQL文を理解していればビッグデータ分析が可能。これまでHadoopを使ったビッグデータ分析には、MapReduceやHiveなどに精通したエンジニアが必要だった。しかし、Pivotal HDはHadoopによるビッグデータ分析のハードルを下げることで、利活用しやすくするための機能が充実している。

Isilonはストレージ環境と同様の運用ができるので、システム担当者はDWH(データウェアハウス)を作成することなく、ビッグデータ環境を実現可能。Pivotal HDはSQLが使えるので、分析担当者は汎用的なBIツールやレポーティングツールによりビッグデータを分析できる。住友氏は「シンプルで使いやすいIsilonとPivotal HDは、DMPにベストな選択です」と話す。

既存のIT資産を生かしたDMP

IsilonとPivotal HDを組み合わせたDMPは、ベンダー製品を組み合わせただけに見えるが、数多くの製品から最適な組み合わせを見つけ出すのは、そもそも非常に困難な作業である。複数の製品を導入してはみたものの、いざ問題が発生すると、どこに問題があるかを切り分け、しかるべきところに問い合わせをするのは簡単なことではない。

住友氏は「IsilonとPivotal HDを組み合わせたDMPであれば、サーバーのサイジングから導入、構築、運用サポートまでを、ワンストップで提供することができます。また、あらかじめ検証済みのDMPを導入できるので、短期間で信頼性の高いシステムを提供できるのが最大の強みです」と語る。

また、データ活用として複雑な統計解析を行いたい場合、統計解析を熟知したエンジニアを有していることも、TEDの強みの一つである。さらに既存のデータベースからマイグレーションする場合も、同社はSQL文の変換をサポートできるエンジニアを有している。住友氏は「ユーザーに近いところで、サポートを提供できるのが強みです」と話す。

さらに住友氏は、「Isilonを導入する、データを入れる、Pivotal HDで分析するというシンプルな構成が最大のポイント。分析した結果をいかにビジネスに直結できるかが最も重要です。既存のIT資産を活かしながらDMPを実現できる、IsilonとPivotal HDの世界をもっと広く紹介していきたい」と語る。