SAPジャパンは9月25日、予測分析ソリューションの最新版「SAP InfiniteInsight 7.0」の提供を開始した。

SAP InfiniteInsightは、予測分析を行うための変数の作成とモデル構築、分析作業を自動化し、データ分析の専門家ではない業務部門のユーザーによるビッグデータ解析を可能にするソリューション。

伝統的なデータマイニングのアプローチを用いると約6週間かかるデータの準備作業とモデル構築・検証作業が、同製品を用いると数時間から1日で完了するという。

同製品では、モデルの質と頑健性の最適な点を見つけるSRM(Structural Risk Minimization:構造的リスク最小化)原理をベースにしたモデリングにより、品質と信頼性を保ちながらモデル作成のプロセスが自動化される。

解析に必要な予測モデル構築は、入手できるすべての変数を活用して複数のモデルを作成し、その中から最適なモデルを選択するだけでなく、機械学習によってより精度の高いモデルを作成できる。

作成したモデルからは、C/Java/SQLなどのコードを作成可能なため、モデルをシステムに組み込んで、業務におけるリアルタイムなアクションを実現する。

最新版では、「サポートするデータベースの追加」「予測モデルの精度向上」「地理情報の対応」が行われている。

「SAP InfiniteInsight 7.0」の新機能

今回、ビッグデータを効率的に分散処理・管理するオープンソースのHadoopや、Pivotal Greenplumをデータソースとして新たにサポートした。モデルから、Hadoop HiveとGreenplumのSQLを生成できる。

予測モデルにおいては、位置・交差・一括交差などの複数の変数を組み合わせて新たな変数を作成して、モデルの精度の向上を実現した。前バージョンの6.5.5に比べて、モデルの精度が10%以上向上している。

地理情報については、経度や緯度などの位置情報を変数として組み込むことが可能となった。位置情報の変数をもとに、予測分析の結果をタイル情報として、Google Earth上に重ねて表示できる。また、KML、GML、Shapefileといった業界標準のフォーマットでエクスポートすることも可能。

加えて、ソーシャルモジュールでの利用にも対応し、指定した場所、時間間隔でのアイテムを取得できる。

Google Earth上に表示した例。地図上の赤い部分は人が密集しているエリアで、クリックすると拡大される