日本IBMは10月10日、専門家の知識とスキルを実装することで、サーバやストレージ、ネットワーク資源を最適に統合し、計画から導入までの作業を簡素化する「エキスパート・インテグレーテッド・システム」において、ビッグデータ処理向けの製品群「IBM PureData System」を発表した。

同製品群は、物理的なIT資源を活用することでビッグデータを高速に処理することを目指したデータ処理に特化して最適化された垂直統合型システム。具体的には、高速データ入出力処理(データベース)向け製品「IBM PureData System for Transaction」、大容量データの高速分析処理(データウェアハウス)向け製品「IBM PureData System for Analytics」、そして次々に取引される業務処理データを蓄積データと照合するといった即自的な分析処理向け製品「IBM PureData System for Operational Analytics」の3製品が提供される。

いずれもそれぞれの処理に最適なアーキテクチャに基づいて構成されており、ユーザーは、データ処理の特性に応じて特性に応じて適切な製品を選択し組み合わせることで、ビッグデータを効率的かつ高速に処理および分析をすることが可能となる。同社では、現在のデータ処理について、「データ処理システムを構築する際に、一貫性のないインストールや設定によりセットアップ/組み合わせにかかる時間やコストがかかり、SIの負担増大や運用コストの増大が発生している」との認識を示しており、その答えとして「IBMはPureData Systemに20億ドルの研究開発/買収への投資を行ってきた。スクラッチで開発したもので、電源を入れ、パターンを設定するだけで使用できるようにすることで、現場の負担を軽減することを可能にした」とPureファミリを提供する意義を語る。

それぞれのデータ集約型ワークロードには、それぞれに適した処理などが求められることから、それぞれに最適化されたシステムで処理を行う必要性が出てきているというのが同社の主張するところ

すでにPureファミリとしては2012年4月に「IBM PureApplication System」ならびに「IBM PUREFlex System」を発表しているが、これらはBIやECサイトにおけるカタログやカートの管理といったトランザクションアプリケーションやトランザクションデータサービス向け(トランザクションワークロード)のものであった。PureDataはSNSと連動したユーザーの感情分析やリアルタイムでの不正検出、ユーザビリティなどの分析といった分析/データサービス(アナリティクスワークロード)向けの製品群となっている。

System for Transactionは、高速なデータ入出力によるデータ更新が頻繁に行われる処理に最適化されたシステムで、多数のユーザー登録や更新が同時発生するような場合でもデータの整合性を保つため、共有ストレージでデータを管理するためにDB2テクノロジーを継承した「DB2 pureScaleテクノロジー」を活用することにより、数時間でデータをロードし使用準備を完了することが可能となっている。また、信頼性の高いデータベースを数分でデプロイ可能なほか、1システムで100を超すデータベースを運用可能となっており、従来比で最大30倍のデータベーススケーラビリティを実現している。

処理内容やデータ量に応じた「Small(1/4ラック、96コア/32TB)」「Medium(1/2ラック、192コア/64TB)」「Large(1ラック、384コア/128TB)」の3つのモデルを用意。対応OSはいずれも「Red Hat Enterprise Linux 6」としている。

PureData System for Transactionのハードウェア構成

System for Analyticsは、同社アプライアンス「Netezza」の次世代版を実装。データ処理プロセスと並列処理機能により、従来システム比で10倍から100倍の高速分析を可能とした。モデルとしては取り扱うデータ量に応じて1/4~10ラック(32TBから1.2PB)が用意されており、最短で数分のうちに複雑な分析結果を導き出すことが可能になるという。

PureData System for Analyticsのハードウェア構成

そしてSystem for Operational Analyticsは同社の「Smart Analytics System」を継承するシステム。大量データを高速分析処理し、かつ、データ更新が高頻度で発生するため、並列処理のしくみと、データ整合性を保つための「トランザクション・ログ管理」といった機能を備えているほか、IBM Cognosソフトウェアによるビジネス・インテリジェンス機能も搭載している。モデルとしては、取り扱うデータ容量に応じて、「Extra Small(64.8TB)」、「Small(151.2TB)」、「Medium(237.6TB」、「Large(624TB)」の4モデルが提供される。

いずれの製品についても、業務の特性に合わせて、どういうデータベースを構築するかという問題に対し、クラスタのトポロジパターンなどがIBMより提供され、それを選択することでそれぞれの要件に応じたシステムを構築することが可能。アプリケーションとどう組わせるかについてもパターンが提供されるほか、ユーザーごとに作られたパターンを共用するサイトも用意されており、それを活用することも可能となっている。同社では、今後もユーザーから許可が得られれば、そうしたパターンを提供し、業界全体で効果を高めていく取り組みも進めていくとしており、すでに複数のパートナー企業が協力していることを強調している。

IBMがこれまで培ってきたノウハウなどを含んだ、それぞれの特性に応じたパターンのほか、パートナー企業などのパターンも提供することで、より細かなパターンの提供を可能としている

なお同社では今後もさまざまなニーズに応えるために、それぞれのニーズに対応するPureシリーズを提供していくとしている。

PureDataシリーズの外観