2014年10月22日(水)、マイナビルーム(東京都千代田区)で開催されるマイナビニュース主催セミナー「プライベートDMPセミナー ~1.7歩先を行く、新マーケティング戦略~」において、Talendは「DMPを成功させるビッグデータ統合とは」と題する講演を行う。本稿では、その内容の一端をご紹介しよう。

Talend株式会社 マーケティングディレクター 寺澤慎祐氏

プライベートDMP(データ・マネジメント・プラットフォーム)を実現するためには、Webサイトを訪問するユーザー情報、興味関心や嗜好性を読み取るオーディエンスデータ、ソーシャルメディアデータなどの外部データに加え、購買情報や顧客プロファイル、アンケート結果など社内のマーケティングデータを集約していく”ビッグデータ統合”が必須要件となる。

ただし、これは口で言うほど簡単なことではない。上記のような構造化データから非構造化データまで、多様なデータタイプやフォーマットが混在する大量のデータを迅速に処理しなければならないからだ。

Talendのマーケティングディレクターである寺澤慎祐氏は、「日次バッチでは間に合いません。リアルタイムに近いデータ処理スピードが求められます」と示唆する。「ビッグデータ統合・分析によって得られたさまざまなインテリジェンスを、マーケティング戦略やターゲティング広告、ECサイトのリコメンドサービスなどの現場にフィードバックしていくことがDMPの目的とするならば、刻々と変化する状況をその時点で察知し、競合他社に対して先手を打てるものでなくては意味がありません」

そうした課題解決を見据え、高速なデータ処理を実現するプラットフォームとして活用されているのが、Hadoop/MapReduceやインメモリ処理といったテクノロジーである。そして、その要件に応えるべくビッグデータ統合ソフトウェアのTalendは進化している。

「今年6月にリリースしたTalend5.5は、ビッグデータ統合におけるパフォーマンスとスケーラビリティの水準をさらに引き上げ、前バージョンのTalend5.4と比較してHadoop/ MapReduceの処理スピードを平均で67%も高速化しました。接続性やデータ品質、セキュリティも強化しており、Talend Studioを併せてお使いいただくことで開発生産性やデータ指向の業務改革にも貢献できます」と寺澤氏は話す。

さらに最近の話題として注目すべきが、「近日中にTalendでApache Sparkをサポートします」というコミットメントである。

Apache Sparkとは、Hadoop/MapReduceを補完し、あらゆるタイプのデータのインタラクティブ分析を可能にするオープンソースの並列データ処理フレームワークだ。「DAG(Database Availability Group)」と呼ばれる革新的な実行エンジンを持ち、従来のデータベースより小さい粒度でデータ処理を行うことを特徴としている。ディスクベースの処理はもとよりインメモリ処理にも対応しており、バッチ処理を行うHadoop/MapReduceに比べて10~100倍の高速化が可能になるという。

「OSS(オープンソースソフトウェア)対応、オープンビジネスを指向するTalendだからこそ、Apache Sparkのような最新テクノロジーを迅速に取り込むことが可能なのです」と寺澤氏。進化するTalendを活用することで、現実的なソリューションとしてDMPを実践していくことが可能となる。

今回の講演で、ビッグデータ統合ソフトウェアTalend 5.5によるプライベートDMPの進化が明らかにされるであろう。