詳細説明その2 - ビッグデータ活用の普及阻害要因を解決するソリューション

次はRon Kasabian氏(Photo36)により、"Unlocking the Intelligence in Big Data"と題した説明が行なわれた。まず簡単にBig Dataの動向であるが、基調講演にもあった通りなにしろ90%のデータが非構造化、つまりとりあえず集めたデータをそのまま突っ込んでる状態である(Photo37)。ではきちんとBig Dataを分析するどんなニーズがあるのか(Photo38)ということで、既に幾つかの事例があることが紹介された(Photo39)。実際にIntelの社内においても、Big Dataを活用することでコスト削減を実現しているとする(Photo40)。

Photo36: General Manager, Big Data SolutionsのRon Kasabian氏

Photo37: とはいえ、Server CostやStorage Costの下落により、データ量が10倍になってもとりあえず突っ込むことは出来る。なので後はこれをどう分析するかという話で、ここに商機があるという分析。

Photo38: 理論的には様々なデータを幅広く収集することで、これまで実現できなかった諸々の分析とか予測が可能になる。これはまぁ、誰でも知っていること。

Photo39: この辺はある意味、Big Dataを引き合いに出すときに必ず出てくる事例ではある。

Photo40: マルウェア検出にもBig Dataが活用できる、というのはちょっと目新しい話であった。

今後はこうしたBig DataがもっとEnd to Endで使われる(Photo41)と予測されており、これはIoTの普及で更に進化してゆくだろうとした(Photo42)。

Photo41: 例えば信号に取り付けられたセンサーから渋滞状況をリアルタイムで判断しつつ、なるべく渋滞を減らすようにリアルタイムで信号を制御する、なんてのもこの一例になるだろう。

Photo42: 左の旅客機のエンジンは、今は稼働時間ベースで定期的にエンジンを下ろしては点検、という原始的な仕組みであるという例として示されたもの。IoTによって、例えば貨物のトラッキングがリアルタイムで出来るといった展開が考えられる。

問題はこうした普及に関しての阻害要因をどう解決してゆくか(Photo43)であり、これに対してのSolutionを提供するとしている(Photo44)。まず処理コストの問題。Photo45はBryant氏の基調講演でいきなり登場したデータだが、こちらではもう少し具体的な数字が示された(Photo46)。この最後に出てきたIntel Distribution for Apache Hadoopの特徴がこちら(Photo47)。要するに内部をIntelのCPUに最適化したとものである。解決方法はともかく、これだけ処理性能が上がれば当然オペレーションコストは下がる事になる。

Photo43: コスト、複雑さ、そして安全性ということで、まぁこれは確かにその通り。

Photo44: 勿論Intelが全てを提供できるわけではないが、幾つかのソリューションがあるという話。

Photo45: 1TBのデータのソートに4時間掛かっていたのが7分に短縮できるという話だが、この時は「どうやって」が一切示されなかった。

Photo46: こちらがその「どうやって」の内訳。何というか、色々無理があるというか...。

Photo47: とりあえずAES-NIへの対応、それとIntel Active Tunerによる最適化は間違いないところ。30倍のソート速度とか8.5倍のHiveへのQueueingに関してはハードウェア構成が違うので「なんともいえない」。

二つ目がデータの複雑性へのソリューションである(Photo48)。こうしたものに対する一つのSolutionとして現在Intelが開発中なのがIntel Graph Builder(Photo49)であり、他にも様々な研究を行なっている、とした(Photo50)。

Photo48: これはLinkedin Mapsを使って、あるユーザーのLink状況を示したもの。

Photo49: ここで言うグラフは(言うまでもないことだが)グラフ理論の方で、ベンチマークの雉に出てくるグラフとは違う。

Photo50: そもそもこの分野はまだ日が浅いだけに、現状はMATLABとかSASといった汎用ツールをブン廻すのが現状で、どのデータをどう解釈するかに関してData Scientistが活躍するといった具合である。このあたりをそれぞれのツールに落とし込むまでにはまだ時間がかかりそうだ。

次ページ詳細説明その3 - 10年でHPCの主要な座に着いたIntel、この先の展開は?