【レポート】

従来の不可能を可能にするストリーミング技術--ビッグデータセミナー土屋氏

河原潤  [2012/08/01]

IBMは、ビッグデータを活用するためのアプローチとして、Hadoopを採用した高速な分散処理基盤やデータ・ウェアハウス(DWH)に加えて、ストリーミング・コンピューティングを駆使したリアルタイム分析ソリューションを提供している。

『ビッグデータ分析プラットフォーム・セミナー』(マイナビ主催)のセッションに登壇した日本IBM ソフトウェア事業 インフォメーション・マネジメント事業部 ワールドワイド ビッグデータ テクニカル・リードの土屋敦氏は、「IBM InfoSphere Streams」ソリューションの事例と特徴を挙げて、リアルタイム分析の適用範囲の広がりをアピールした。



新生児医療に貢献するストリーミング・コンピューティング

日本IBM ソフトウェア事業 インフォメーション・マネジメント事業部 ワールドワイド ビッグデータ テクニカル・リードの土屋敦氏

ビッグデータの特性は、量(Volume)・種類(Variety)・速度および生成頻度(Velocity)の"3つのV"で表現でき、それぞれの特性に応じて最もふさわしいアプローチを提供する――折に触れ説明されてきたIBMのビッグデータ戦略に沿って、土屋氏のセッションでは、3つのVのうちデータのVelocityに着目したリアルタイム分析のアプローチに焦点が当てられた。

その代表的な事例として冒頭より紹介されたのが、カナダのオンタリオ工科大学の新生児集中治療室(NICU)におけるリアルタイム分析プロジェクトである。NICUでは、搬送された新生児の容体を24時間体制でモニタリングしているが、その業務に携わる医師・看護師の肉体的・精神的な負担は非常に大きく、人為的ミスのリスクを抱えている。そこで始動したのが、オンタリオ工科大学とトロント大学、IBMによる新生児のバイタル・データをリアルタイムで分析し、院内感染や心肺停止などの罹患リスクの早期発見を行うというプロジェクトだ。

「従来の医療現場では紙に記されたバイタル・データを人間の目で追っていたが、患者の急変を検知するための情報を得るには、人間には到底追えない量のデータを収集・分析する必要がある」と土屋氏。そして、患者に装着したセンサーから収集した膨大かつ多種なバイタル・データを扱うために採用されたのが、IBMが2003年より研究を行ってきたストリーム・コンピューティングである。IBMはこのテクノロジーを2010年に「IBM InfoSphere Streams」として製品化し提供している。

オンタリオ工科大学のリアルタイム分析システムでは、体温、心拍数、血圧値・血液成分といった新生児の多様かつ膨大なバイタル・データがストリーム・データ(連続的に流れるデータ)としてモニタリングされる。

ストリーム・データはまず、Streamsによって異常や異常の兆候の判断がその場でなされた後、データ・ウェアハウス(DWH)アプライアンスの「IBM Netezza」で管理・蓄積される。その際、統計解析ソフトウェア「IBM SPSS」を用いて、Streamsによる処理で得られた新たな発見などを分析モデルとして抽出し、その後のリアルタイム分析にフィードバックするという仕組みがとれる。

土屋氏は、このシステムにおけるポイントを「単に、その場でのしきい値を超えた/超えないの判断にとどまるのではなく、処理のパターンから分析モデルを抽出し、リアルタイムで行われる高度な相関分析を長期的に活用していくことができる点にある」と説明した。

StreamsとSPSS、Netezzaなどを組み合わせたリアルタイム分析によって、オンタリオ工科大学のNICUでは、従来より最大で24時間も早く、新生児の容体異常を正確に検知できるようになり、死亡・罹患リスクの低減や新たな臨床仮説検証が可能になったという。

ストリーム・コンピューティングが有効な分野とユースケース。医療のほかにもさまざまな分野で利用されている。

InfoSphere Streamsに備わる3つの特徴

先進事例を示したうえで、土屋氏は、Streamsが採用したストリーム・コンピューティングの技術的な仕組みについてスライドを用いながら次のように解説した。

「従来の分析手法は、静的な過去のデータからすでに起こった事実を発見するものだが、ストリーム・コンピューティングでは今、目の前を流れているデータをとらえて、そこから今、何が起こっているのかを分析する。従来との最大の違いは、データをディスクに保管せずに、高速なメモリ上で連続的に処理・整形・分析を行う『センス&レスポンス手法』にある」

続いて土屋氏は、Streamsが備えている特徴として、(1)圧倒的なパフォーマンス、(2)高い開発生産性、(3)多彩な連携機能とツールキットの3点を挙げ、それぞれについて説明した。

(1)について、Streamsではランタイム実行環境に64ビットのLinux OSが稼働する同社のPOWER7/Intelブレードサーバーが採用され、最大125台のサーバークラスタに対応した高い拡張性が確保されている。(2)については、ストリーム・コンピューティングの処理フローを定義しロジックを実装するための専用言語「SPL(Streams Processing Language)」が提供されている。このSPLを用いることで、高度な分散処理の仕組みを隠蔽した形でシステムが構築できるようになる。また、ユーザー定義オプションによって、JavaやC++など標準的な開発言語を用いてロジックを実装することも可能だ。(3)は、(2)にもかかわる特徴で、標準ツールキットに含まれるモジュールを利用することで、主要な処理に関してはフローを一から記述する必要がない。加えて、データ・マイニング、統計モジュールなどの拡張ツールキットが提供されるほか、音声やビデオ、地理情報などの分析ロジックの実装にも対応している。

Smarter Planetビジョンに基づき、地球規模の課題を解決する

IBMがストリーム・コンピューティングを製品化した背景にあるのが、同社が2008年11月以降企業スローガンとして掲げている「Smarter Planet」ビジョンだ。セッション後半に紹介された、Streamsを活用した気象分野での2つの事例は、「地球規模の諸課題に対して、より賢く、効率的な解決策を提示していく」という同ビジョンにふさわしい取り組みだと言える。

1つ目は米国NOAA(気象庁)におけるハリケーン進路予測分析プロジェクトである。このプロジェクトでは、全米各所に設置したセンサーから収集される気象データを、他の関連データ(進路上にある耕地に与える影響を測るための先物取引市場の株価など)と併せて分析し、ハリケーンの進路をリアルタイムに予測するというもの。これによりNOAAは、ハリケーンの警戒情報を早期に発することができるようになったのと同時に、影響を及ぼす地域のサプライチェーンへの正確なリスクアセスメントが可能になった。

2つ目は、アイルランド・ゴールウェイ湾の危機管理プロジェクトだ。このプロジェクトでは、同湾の水質および生態系をモニタリングすることによって、有害物質の発生や潮流の変化を、しきい値を設定してリアルタイムに検知し、水産業をはじめとする関係業界に最新かつ有用な情報を提供している。赤潮の大量発生などが同地域の産業にもたらす被害は数億円単位に上るが、このシステムを導入したことで、そうしたリスクが極小化されることとなった。

「ストリーム・コンピューティングは、従来の手法では不可能だったことを可能にする、ビッグデータ活用でカギを握るテクノロジーである。本日紹介した医療、気象のほか、モニタリングの対象を変えることで、製造や流通、通信、交通、金融、警察・防衛などあらゆる業界が導入効果を享受することができる」と土屋氏は強調した。

同氏は最後に、ビッグデータ活用のための包括的なアーキテクチャの下、ユーザー企業が自社で扱うデータの特性に合わせて各種ミドルウェアを選択できるのがIBMの強みであるとアピールしてセッションを締めくくった。

「ビッグデータ分析プラットフォーム・セミナー」総力レポート!!

『ビッグデータ分析プラットフォーム・セミナー』
講演資料、無料ダウンロード提供中!!


6月19日に開催した『ビッグデータ分析プラットフォーム・セミナー』における各セッションの講演資料を無料でダウンロード提供しております。

ご希望の方はこちらのWebサイトにてお申込みください。

なお、ダウンロードには個人情報の入力が必要になりますが、メールの署名などのテキストデータをコピー&ペーストするだけで各項目が自動入力される「かんたん入力」機能もご用意しております。入力作業がわずか数秒で終わる便利な機能ですので、ぜひともご活用ください。

⇒講演資料ダウンロードページ

    関連したタグ

    新着記事

    求人情報

    人気記事

    一覧

    イチオシ記事

    新着記事

    転職ノウハウ

    あなたの仕事適性診断

    4つの診断で、自分の適性を見つめなおそう!

    Heroes File ~挑戦者たち~

    働くこと・挑戦し続けることへの思いを綴ったインタビュー

    はじめての転職診断

    あなたにピッタリのアドバイスを読むことができます。

    転職Q&A

    転職に必要な情報が収集できます

    スカウト転職する

    企業からアプローチのメッセージが届きます。