昨今、最も注目されているキーワードの一つがビッグデータだ。データを起点とした業務変革や経営の意思決定が、今後のビジネスを大きく変えていくと期待されている。ただし、扱うデータの量や種類、頻度が増大するとともに、その処理時間や品質確保などさまざまな問題に直面することになる。この課題解決に向けて多様な情報ソースからデータを集め、連携・統合するソフトウェアを提供するTalendは、2014年4月24日に開催されたマイナビニュース主催セミナー「勝つためのビッグデータ~経営の武器となる現実的なデータ活用とは~」に登場、データを情報に、そしてインテリジェンスへと変えていく“勝つためのビッグデータ”を熱く語った。

OSSとオープンビジネスを追求しすべてのデータから価値を生み出す

Talend株式会社 マーケティングディレクター 寺澤 慎祐 氏

Talendは「すべてのデータから価値を生み出す」ことを自らのミッションとするビッグデータ統合ソフトウェアのベンダーだ。ベルトランド・ディアド氏とファビルス・ボナン氏の2人のエンジニアによってフランスで創業した同社が、事業を開始したのは2005年のこと。その当時から一貫して追求しているのが、OSS(オープンソースソフトウェア)とオープンビジネスである。同社マーケティングディレクターの寺澤慎祐氏は、「この2つのオープン戦略こそが、当社の強みの源泉になっています」と語る。

Talendコミュニティのメンバー数は約4万5000人。この規模は、Linux、MySQL、PostgreSQLに次ぐ、世界第4位にランクされている。また、そのうちの約1500人が品質テストに携わっている。これは、データ統合ソフトウェアの分野では異例の体制だ。同等のマンパワーをかけて品質テストを行っているベンダーは商用製品を含めても、多くはないと思われる。

「当社は半年に一度のペースでソフトウェアのバージョンアップを行っています。このような短期間のサイクルで改善・強化を図ることができるのは、まさにTalendのコミュニティメンバーが、互換性チェックをはじめとする品質テストを担ってくれているからに他なりません」と寺澤氏は語る。

実際、Talendのデータ統合ソフトウェアのユーザーは急速な勢いで伸びている。これまでの累積ダウンロード数は2000万を超え、そのうちの100万人がアクティブユーザーと見られている。また、4,000社を超える企業が商用版に移行している。これに伴い、同社は前年度比128%の成長を果たし、OSS系ベンダーの売上高としては、ついに世界第2位までに上りつめているという。

Talendが考える「ビックデータ活用と課題」

多種多様なデータソースとつながる500以上のコネクタを提供

データは単に存在するだけでは役に立たない。「“データ”をその統合や連携を通じて意味を持った“情報”に変え、さらに洞察を加えて“インテリジェンス”に変えることができて、初めて売上アップや収益アップ、あるいはコスト削減といった成果を生み出すことができるのです」と寺澤氏は語るとともに、「得られるインテリジェンスの大きさは、集めたビッグデータの量や質に比例します」と強調する。

ただ、そうしたビッグデータへの拡張を図る中では「多種多様な情報ソースへコネクトできない」「データおよびビッグデータが保管されている環境(オンプレミス/クラウド)を分け隔てなく簡単に使えない」「ビッグデータによって変わる市場変化をキャッチして俊敏に対応できない」「ビッグデータ対応になることで投資額が増えてしまう」といった、これまでとは質の異なる新たな課題が生まれてくる。

これらの課題解決にTalendの真価が発揮されるのである。「例えば多種多様なデータソースとの接続に関して、Talendのビッグデータ統合ソフトウェアにはTalend製品に同梱されている500のコンポーネントとコミュニティリリースとして500以上のコンポーネントが用意されています。サポートしていない情報ソースや特殊用途の場合は、ユーザー自身が標準技術を使ってコンポーネントを開発することも可能です」と寺澤氏は語る。

さらに、Talendであればオンプレミス環境上でもクラウド環境上でも、データソースの場所を意識することなくコネクトしてデータを収集できる。No SQL DBやHadoopをはじめ、最先端の分散処理技術を容易に活用できるAPIも用意されており、100%標準技術を使って静的データから動的データ、非構造化データまで含めたビッグデータ統合をシンプルに実現し、市場変化を俊敏にキャッチアップできる。

また、ビッグデータの量の変化は予測困難であることから、データ量や情報ソースコネクタの数に依存した従来の統合ソフトウェアのライセンスモデルは不確実でリスクが高く、導入に二の足を踏む企業は少なくなかった。これに対してTalendのライセンスモデルは利用者数を単位としており、新しいコンポーネントも無料で提供される。「将来にわたって必要となる費用を予測し、ROIを最大化する投資計画を立てることができるのです」と寺澤氏は語る。

「Talend Studio」はビッグデータ統合ツール

ビッグデータ統合ジョブをHadoop上でネイティブに実行

そのほかにもビッグデータへの拡充には、Volume(量)が増えることによる処理時間の増大、Variety(種類)が増えることによるデータ品質のバラツキ、Velocity(頻度)が増えることによるバッチ処理の効率低下など、さまざまな課題に直面する。

こうした運用上の問題にも、Talendは「かつてない高速化による解決策を提供します」と寺澤氏は語る。GUIベースの開発環境であるTalend Studioで生成されたプログラム(可読可能なjarファイル)をHadoop上でネイティブに稼働させることで、ビッグデータ統合、連携、クレンジングなどの負荷の重いジョブを多数のノードで分散処理し、圧倒的なスピードで実行するのである。

「従来は1週間以上もかかっていたバッチジョブをHadoop上に実装することで、リードタイムをわずか1日に短縮。運用コストを10分の1以下に抑えたケースもあります」と、寺澤氏は実際のユーザー企業における成果を紹介する。

画期的な高速化によって、インテリジェンスから導き出された新たな知見(ルール、手法、仕組み、アルゴリズムなど)を、迅速にTalend Studioにフィードバック。再設計されたビッグデータ統合基盤のもとでPDCAサイクルを回すことが可能となる。

Talendの導入ユーザーはグローバルカンパニーが多く、英国の携帯電話大手ボーダフォン、インターネット通信販売やオークション大手のeBay、金融サービスのシティバンク、USDA(アメリカ合衆国農務省)など、世界の著名な企業や公共機関がTalendのソフトウェアを導入している。

システムの構成図や概念図、相関図などを記述する際、モジュール間やシステム間を“矢印”でつないでいる。これらの“矢印”を書くこと自体は簡単だが、いざそれを実現する際には多大な困難と苦労が伴うのが実情だった。「そんな“矢印”に関するあらゆるニーズにTalendが応えていきます」と寺澤氏は力強く宣言して講演を締めくくった。