日本ヒューレット・パッカード(HPE)は10月5日、都内で記者会見を開き、次世代データ分析プラットフォーム「HPE Vertica 8」と、分析データの近代的アプリケーションを構築するためのツールである「HPE Haven OnDemand Combinations」を発表した。

データ分析プラットフォーム「HPE Vertica 8」

HPEでは、企業がデータセンター内の複数のサイロに格納されているデータからどのようにして有効なデータを引き出すのかということを課題の1つとして挙げており、Vertica 8は統合アーキテクチャおよびインデータベース分析機能や、その場で分析を可能にする独自の統合アーキテクチャにより、情報の格納場所に関係なく、継続的に有効なデータの抽出が可能だという。

企業はVertica 8のデプロイメントオプションを活用し、オンプレミス、プライベートクラウド、パブリッククラウドの環境を問わず、さらにHadoopデータレイクでも、分析を実施する場所や手法を選んで最適のソリューションを採用できるとしている。

さらに、データの移動および統合機能を強化し、数百ないし数千カラムへのデータロードが最大700%まで速くなり、Amazon S3からの簡単なデータロード、およびApache Kafkaデータストリームの包括的なビジュアルモニタリングなどを実現。

HPE 「HPE Vertica」製品責任者のエイモン・オニール氏

新製品について「データのタイプにより、ストレージのスペースを削減できるようにしている。また、Hadoop Sparkのように分散化されており、従来よりスケーリング、可用性が改善されているほか、最新情報に更新するために作業する必要はなく、自動的に情報を取得、リカバリーする。さらに、IoTのデータ分析も行っており、従来のビジネスデータと違い、機械が生成したデータの分析に使われているため、予測的な分析など高度な分析ができる」とHPE 「HPE Vertica」製品責任者のエイモン・オニール氏は語る。

主な特徴として「インデータベース機械学習」「Hadoop上での現場分析」「マルチクラウド機能およびサポートの強化」「Apache Sparkアダプタの最適化」などを挙げている。

インデータベース機械学習については、従来の機械学習アプリケーションではデータサイエンティストがデータの一部分だけを用いてモデル設計と調節を行わなければならず、結果として正確性が低下し、遅延が生じていたという。インデータベースを適用した機械学習アルゴリズムでは、大規模データ向けにRベースの機械学習モデルをあらかじめ作り、直接的に展開することが可能となり、高い精度で意思決定プロセスを加速することを可能としている。

Hadoop上で現場分析に関しては、ユーザーはVerticaのParquetとORC Readersを使うことで、価値あるデータをHadoopデータレイクから導くことができるほか、データのコピーや移動を行うことなくHadoopデータレイクに存在するデータにアクセスし、分析することが可能だという。

マルチクラウド機能およびサポートの強化では、AWSとMicrosoft Azureクラウド両方のデプロイメントに最適化されていることに加え、S3へのシームレスなアクセスおよびセキュリティなどにより、AWSへの対応が強化されている。

Apache Sparkアダプタの最適化については、VerticaとSparkシステム間の高速なデータ連携を可能とし、データサイエンティストは小規模データのクエリでは、Spark内に堅牢な機械学習モデルを構築。また、大規模スケールで最大規模のデータ量における最も高度なクエリでは、広範なVerticaのインデータベースSQL分析を活用することができるという。

Vertica 8は今期から販売を開始し、価格は1TBあたり840万円(税別)。

「HPE Vertica 8」の概要

クラウド型サービス「HPE Haven OnDemand Combinations」

「HPE Haven OnDemand」は現時点で70以上の機械学習APIを備えており、個人のソフトウェア・アーキテクトやデータ・サイエンティストから、大規模な開発チームを抱える企業まで、1万8000人超のユーザーに使用されている。同プラットフォームのユーザーにより、国内外で数千のアプリケーションが開発され、結果として月間数百万のAPIの呼び出しが発生している。

開発者向けグラフィック環境の図

今回、発表したHaven OnDemand Combinationsにより、アプリ開発者は機械学習機能を取り入れた次世代アプリケーションの構築が図れ、既成のコグニティブサービスの一覧と直感的なドラッグ&ドロップ型インタフェースを備えている。開発者は複数の機械学習APIを組み合わせて、そのコードを開発中のプロジェクトに直接コピー&ペーストして、モバイル向け・企業向けアプリを開発できるという。

また、簡素化されたコーディングとパフォーマンスを向上し、複雑なコードを無制限の変換や並行処理をサポートする単一のAPI呼び出しにまとめたことに加え、API呼び出しの回数の低減により、遅延を減少させた。また、APIの組み合わせはセキュリティが守られた形で組織のアカウントに公開され、再利用や拡張が可能。

HPE ビッグデータソリューション事業本部 マーケティング担当 バイスプレジデント ジェフ・ヴァイス氏

HPE ビッグデータソリューション事業本部 マーケティング担当 バイスプレジデント ジェフ・ヴァイス氏は「われわれはビッグデータに関してVertica、IDOL、Haven OnDemandを有し、これらはプラットフォームとして提供しており、ソフトウェアは大半の主要プロバイダーのクラウドで動作するように設計されており、Haven OnDemandは70以上のAPIをサポートし、簡単な作業から顔認識など複雑な業務などが幅広い業務に活用が可能だ。今回、発表したHaven OnDemand Combinationsは、多くのAPIをつなげてサービスとして提供できるほか、例えばコグニティブサービスを作る際に、どの言語を用いるのかという指示を与える必要がなく、言語を自動的に検知・分析することが可能だ。われわれは2年前に世界中からアクセスが可能なオープンパブリックデータを構築し、200のハッカソンで得られた有効なフィードバックを基に改善を行い、結果としてHaven OnDemand Combinationsなどの製品につながっている」と述べた。

Haven OnDemand Combinationsは開発者版と商用版を用意しており、無料アカウントに登録すれば、試作アプリ用の新たなAPIの組み合わせを無料で作成できるほか、有料ユーザーは無料アカウントの使用制限が解除され、企業クライアント・レベルのサービスを利用できる。ディストリビューションはMicrosft Azureのグローバルネットワークを通じ、2016年度第4四半期中に提供開始を予定している。