サイベースは7月16日、BI製品「Sybase IQ 15.1」日本語版の発表にともない、ユーザー/パートナー向けの説明会「Sybase IQ 新バージョン発表会」を開催。米サイベースでプロダクトマーケティング ディレクターを務めるダニエル・ラール氏が新製品の特徴やBI市場の動向、同製品がビジネスにどのように貢献するかなどを説明した。

米サイベース プロダクトマーケティング ディレクター ダニエル・ラール氏

Sybase IQは、データ分析やリポーティングに特化したカラムストア型のデータベース製品。汎用RDBMSがロー単位でデータを格納するのに対して、Sybase IQでは、カラム単位でデータを格納する独自のアークテクチャを採用し、汎用RDMSに比べて、高速なレスポンス、効率的なデータ圧縮を実現していることが大きな特徴。現在、全世界で約1,650社(約3,000システム)、国内で約240社のユーザー企業がいる。

ラール氏は、カラムストア型DBの特徴について、「汎用RDBMSでは、テーブルをフルスキャニングしてからカラムにクエリを行うため、無駄なI/Oが発生する。レスポンスを高めようとインデックスを作成すれば、データベースは急激に拡大し、膨大な時間とリソースが必要になる。一方、Sybase IQでは、各カラムのデータそのものがインデックスであり、カラム単位でデータを抜き出すことができる。このため、I/O、ストレージ・コストは劇的に削減される」と説明する。

例えば、1,000万レコードの会員データベースから、特定のカラムの値を抜き出す場合(カリフォルニアの男性会員のうち何人がバレンタインデーに宝石を買ったことがあるかなど)、汎用RDBMSで、50万 I/Oかかるところが、カラム型DBでは、234 I/Oで済むという。実例として挙げられた、米国の大手ヘルスケア企業のケースでは、Oracleで38時間かかった処理が3分で済むといったように平均で102倍の高速性が得られたとする。

また、データ圧縮については、1TBのデータが、0.25から0.9TBに圧縮されて格納される(サマリテーブル:0-0.1TB、インデックス:0.05 - 0.3TB、生データ:0.2 - 0.5TB)など、RDBMSと比較して3分の1から6分の1のデータ量で済むという。事例としては、テレフォニカ(70TBから15TBに)、コムスコア・ネットワーク(40TBから16TBに)、韓国保険審査評価院(27TBから12TBに)などを挙げた。

汎用RDBMSとカラムストア型データベースの違い

汎用RDBMSとSybase IQのデータ圧縮の比較

そのうえで、「ディスクやコンピュータパワーが節約できるほか、インデックス作成や事前集計、キューブ作成といったチューニング工数、手作業によるSQL最適化作業の工数を半減できる。Sybase IQによるTCO削減効果は大きい」と説明した。

ラール氏は、世界最初のコンピュータであるENIACが、弾道計算という「分析」目的のために利用されたことを引き合いにだしながら、「RDBMSが発展するなかで、ITはフロント/バックオフィスの業務効率化、すなわち、OLTPに比重が置かれるようになり、コンピュータの能力と分析ニーズの間にギャップが発生してしまった。このギャップは、1980年代の意思決定支援システム、1990年代のDWH、2000年代のBIシステムというアプローチが採用されるなかでも縮まらず、さらに広がった。しかし、今日は、予測と意思決定の差が企業競争力を左右する時代だ。BIは、競争力強化の重要な鍵であり、企業内にある情報をただちに活用する戦術的なBIが求められている」と、同製品がITと分析ニーズのギャップを埋め、ビジネスに直接貢献するものであることを強調した。

新バージョン15.1で新たに加わった機能「インデータベース分析」も、従来のように遅く非効率で、ビジネス的な“勘”に頼らざるをえなかった、予測と意思決定のあり方を変えることを目指したものという。インデータベース分析は、統計ライブラリ、OLAPエクステンション、分析アルゴリズムなどをSybase IQ内に組み込むことで、従来、BIアプリケーション側に送って実行していたドリルダウンや予測分析などのデータ処理を高速に処理できるようにしたものだ。

同製品の次のステップとしては、非リレーショナル型の分散型データ分析(テキスト分析や分散処理、クラウドへの対応など)、高性能リアルタイム分析(リアルタイム・ロード/クエリ、高度なパティショニング、グリッド・ロード・バランス)といった機能を実現していく予定という。