日本アイ・ビー・エム 理事 ソフトウェア事業 Information Management事業部長 俵雄一氏

日本アイ・ビー・エムは5月23日、Big dataと呼ばれる多様化かつ頻発する膨大な量のデータを分析するための製品として、「IBM InfoSphere BigInsights Enterprise Edition V1.1」と「IBM InfoSphere Streams V2.0」を発表した。

理事 ソフトウェア事業 Information Management事業部長の俵雄一氏は、「IBMのBig dataに対するアプローチがカバーするエリアは『Variety』『Velocity』『Volume』の3つ。企業がBig dataを活用するための製品として、管理・統合・分析・ガバナンス・セキュリティ&ライフサイクルというジャンルに属するInformation Management製品群を提供する。今回発表した2製品は分析に含まれる」と説明した。

同社は分析のための製品ラインとしてBAO(ビジネス・アナリティクス・アンド・オプティマイゼーション)を提供しているが、新製品はBAOにつながるためのインフラを構築するためのものに当たる。

Big dataを活用するためのInformation Management製品群のラインアップ

日本アイ・ビー・エム ソフトウェア事業部 インフォメーション・マネジメント事業部 マーケティング・マネージャーの中林紀彦氏

新製品の詳細については、ソフトウェア事業部 インフォメーション・マネジメント事業部 マーケティング・マネージャーの中林紀彦氏から説明がなされた。同氏は、「Big dataが使われ始めるにつれ、課題が出てきている。例えば、大容量データを処理するための技術として、Hadoopが注目を集めているがそのまま使うことは簡単ではなく、HDFSは信頼性の点で課題がある」と説明した。

というのも、HDFSのnameNode(管理側)において、通常のファイルシステムと同じように書き込み前のデータがファイル・キャッシュ上にある状態の場合などは、停電などですべてのノードで電源が落ちてしまうと一部のデータが壊れてしまうケースもあり得るからだ。こうしたことから、同社では現在、耐障害性に優れたファイルシステムの適用を検討している。

今回、Hadoopをベースに開発されたのが、構造化の有無にかかわらず大量データを分析できる「BigInsights Enterprise Edition V1.1」だ。同製品は、プログラミング言語として「Pig」、データ収集/修正ツールとして「Flume」、テキスト検索ツールとして「Lucene」が採用されている。さらに、同社独自の機能として、管理コンソール、大規模な半構造化データを分析しやすいよう設計されたクエリー言語「Jaql」、Eclipseベースの統合開発環境が盛り込まれている。

同製品について、機能を限定し利用可能なデータ容量も10TBまでとすることで無償で提供する「BigInsights Basic Edition V1.1」も発表された。

BigInsights V1.1の2つのエディション

一方「InfoSphere Streams V2.0」は、大量のストリーミングデータをリアルタイムで分析できる製品だ。今回、Stream Processing Languageの大幅な機能拡張を図ったことで、従来比の3.5倍の速度で分析処理ができるようになった。

BigInsights Enterprise Edition V1.1の価格は1TB当たり285万円から、Streams V2.0の価格は1コア当たり464万円から、許可ユーザー当たりの開発者向けライセンスが38万3,100円となっている。