キーノートでは企業のFounder、 VP、CIO、 Fellowの方が自社の取り組みあるいは自社製品の紹介が中心でした。企業の場合、Keynoteは自社の社員や関係者が講演するSessionへの誘導となっているケースが多いです。アカデミック側から心理学や社会学のバックグランドを持つ研究者がその立場からビッグデータについて講演されていました。

Tutorial/Sessionはパラレルで開催されため、参加者の興味や対象は絞られますが、Keynoteはシングルで最も多くの参加者を集め、かつ講演者の持ち時間が5~20分と非常に短いため、個々のテーマについて掘り下げるよりは、現在のトレンドやメッセージのインプットの場になります。テーマとしては半数以上が機械学習を何らかの形で取り上げていました。機械学習の応用事例というと半分、いやそれ以上の高い確率でレコメンドばかりでしたが、今年はそれ以外のコンシュマー向けのサービスも今年は増えていました。特に、Microsoft社の画像からそこに写った人の年齢を当てるというデモへの反響が大きかったです。

ヘルスケアの事例では、分析環境を病院や研究機関に導入し、病気診断や予測に用いられている話がありました。全体的なトレンドとしては、クラウドの利用とリアルタイム処理です。秘匿性の高さでは世界有数と思われるCIAや、秘匿性の高さでは劣るかもしれませんが、データ量では世界有数と思われるNetFlixもオンプレミスでなくクラウド上でデータ分析処理を行っているそうです。

最新の技術やトレンドに触れる機会もありますが、「人類が増えすぎたデータをクラウドに蓄積させるようになって、既に半世紀が過ぎていた。クラウドは人類の第二の頭脳となり、データはそこで・・・」と未来を連想する機会もあるのがKeynoteの良いところです。

製品はCloudera社からの新プロダクトであるKudoの発表の反響が大きかったように思いました。KudoはHadoopのストレージであるHDFSやHBaseのギャップを埋めるプロダクトとして紹介されています。その後のKudoのセッションは部屋に人が入りきれないほどの盛況で、参加者の関心の高さを伺えました。また各製品はほぼ共通してIoT(Internet of things)のデータの標準的なフォーマットであるJSON、かつリアルタイム処理への対応が進んでいることが伺えました。

他のSessionで紹介されたCloudera社から既に発表されていたIbisも興味深いプロジェクトでした。IbisはPythonでSparkを実行できるAPIです。これでPythonの使い手にとっては、PySpark(Sparkを実行できるPython API)以外の選択肢が増えたことになります。

Kyenoteの会場

企業ブース

企業ブースは、スポンサー企業のブースが並び、一度足を踏み入れると、積極的に呼びかけられ、大学のサークルの新人勧誘を思い起こさせます。企業ブースはスケジュールの合間のBreakを利用して回ることになると思いますが、Session終了後にも回る時間が取れます。それでも足りなければ昼食時間を削り、その時間を確保すると言う選択肢もあります。とはいっても約200社もブースがあるので、あらかじめ見るべきブースを絞っておいた方が、効率的に情報収集が出来ます。

自分の英語力を試す良い機会でもありますが、関連製品、例えばBI/BAツールを横並びで比較することも出来ます。日本ではあまり紹介されていない製品でも、開発のスタッフから技術的な話を聞けたり、営業からはどんなお客に選ばれているか、そしてその理由を聞くことができます。領域が広い分、自分で仮説なり目的を持ち調査しないと必要な情報は得られませんし、逆に、目的意識がはっきりしていれば、インプットだけでなく自身の仮説を検証するアウトプットの場にもなり、出展企業のノベリティやT-shirt以上のものが得られます。

私はBI/BAツールや機械学習のツールやプロジェクトを中心に回ってきました。多くがHadoop/Spark連携を謳っていました。実際には連携の度合いがまちまちで、そこはセールストークを鵜呑みにせず、実際に操作させてもらって確認しました。

企業ブース入り口