ビッグデータ活用を支える基盤技術の中でも分散処理のフレームワークとして注目され、ビッグデータの中核的な技術となりつつある Hadoop。このHadoopを、企業はどのように活用すればよいのか。9月12日にマイナビが開催する、イベント「マイナビニュースITサミット - ビッグデータ活用を支えるHadoopセミナー」では、その解について提示される予定だ。本稿では、このセミナーに登壇予定で、「EMC社製 Isilon スケールアウト NAS」を取り扱う図研ネットウエイブ 営業本部第二営業部の岡田隆志氏と、Talendマーケティングディレクターの寺澤慎祐氏に登場いただき、Hadoop環境でのビッグデータ活用を支援する連携ソリューションについて紹介してもらった。

ビッグデータに不可欠なスケールアウトストレージとデータ統合ソリューション

基幹業務で運用されるデータ、SNS 上のコメント等のデータ、IoT(Internet of Things)におけるセンサー等が生成するデータ、そして気象情報や交通情報など様々なタイプのデータを分析・解析し、経営や業務に活かすため、ビッグデータを収集、蓄積する仕組みは多くの企業から注目されている。

ビッグデータの蓄積にはストレージが必須だが、現在、こうしたストレージの運用が企業にとって大きな課題となっている。ビジネスで扱われるデータが急激に増えた結果、容量がひっ迫され、より容量の大きなストレージを新規導入したり、既存の物と置き換えたりと、ストレージの拡張にかかる運用の負荷が増大しているためだ。

図研ネットウエイブ
営業本部第二営業部
岡田 隆志 氏

「多様なデータを収集し分析するために、社内にあるさまざまな構造化データや非構造化データをひとまとめにして管理する『データレイク』という考え方が広まっています。ビックデータ活用を行うために、まずは大量のデータを容易に管理し、いつでも使える状態にしておくことが重要です。 我々が提案しているEMC社製 Isilon スケールアウトNAS製品の一番のメリットは、パフォーマンスやスケーラビリティを簡単に拡張できるという点にあります」と、図研ネットウエイブの岡田氏は、ビッグデータ・ストレージとしての「Isilon スケールアウト NAS」の優位性を強調する。

また、Isilon スケールアウト NASはHadoopの分散ファイルシステムである「HDFS」をサポートしており、Hadoopでのデータ分析処理が容易になるという。そして、Hadoopによるデータ分析に多様性をもたらすのが、フランス生まれのソフトウェア・ベンチャー企業Talendが提供する、データ統合ソリューション「Talend」だ。

ビッグデータは、Volume(大量性)、Variety(多様性)、Velocity(高速性)という、3つの「V」によって特徴付けられると言われる。Talendは500を超えるコネクタコンポーネントを持ち、さまざまなデータソースと統合することが可能である背景で、Variety(多様性)の観点で特に大きな強さを見せる。

ビッグデータの分析処理プラットフォーム「Hadoop」と、データ統合ソリューション「Talend」、そしてビッグデータ・ストレージとしてのスケールアウトNAS「EMC Isilon」。この3つを組み合わせることで、スケーラビリティを確保しながらより多様なビッグデータの分析・活用の実現が期待できる。現に図研ネットウエイブとTalendは今年7月より共同マーケティングを開始し、企業のビッグデータ活用支援を積極的に展開している。

Talend株式会社
マーケティングディレクター
寺澤 慎祐 氏

両社はマイナビが9月12日(金)にパレスサイドビル(東京・竹橋)で開催する、企業のHadoop活用をテーマとしたイベント「マイナビニュースITサミット - ビッグデータ活用を支えるHadoopセミナー」において、「ビッグデータ活用が変わる。~連携ソリューションで実現するHadoopプラットフォーム~」と題したセッションを行う予定だ。

ビッグデータを活用した意思決定や業務改善、営業施策の実現に関心をお持ちの方々は、ぜひ足を運んでいただきたい。 「ビッグデータというと、つい大量性にばかり目が行きがちですが、いかにデータの多様性を担保するかという観点もビッグデータ活用には不可欠です。 Talendは4万5,000人のコミュニティメンバーを抱えるオープンソースのツールであるという特徴を活かし、ほとんどすべてのデータソースに接続し、データ統合を実現します」と、Talendの寺澤慎氏は同ソリューションの強みを説明する。