富士通は5月7日、HPC技術およびプラットフォームの一般業務分野での活用推進の一環として、HPCの並列分散処理技術を用いて、ビッグデータ領域におけるBusiness Analytics(BA)業務を計算するベンチマークテストを実施、その結果を発表した。

実施したベンチマークテストは、株価予測から取引戦略を策定する金融分野、店舗における商品需要を予測する流通分野の2種のプログラムで、その結果、両分野とも計算時間が、サーバ1台の並列処理で約12分の1に、また、サーバ2台で約21分の1に短縮するなど、HPC技術の並列効果がリニアに性能へ反映される良好な結果が得られた。

従来、BA業務を行う際、データ収集から分析モデルの作成、分析・予測処理まで実行すると、膨大な時間がかかる場合があったが、今回のベンチマークテストでは、分析・予測計算部分だけを別サーバに切り出し、統計解析向けプログラミング言語「R」で記述されたシミュレーション・プログラムを、最新のPCクラスタプラットフォームでの並列分散処理に対応させて実行した。

ベンチマークテストの実施内容

金融分野のベンチマークテストは、過去2年間の株価変動実績から株価を予測し、予測した株価から売買注文ルールごとに利益予測するシミュレーションを、今回、約2,000銘柄それぞれについて、株価予測と利益予測を行った。

その結果、約2,000銘柄の株式戦略取引の利益予測計算所要時間は下記のとおりとなった。

  • 並列分散処理対応前:90分間
  • 並列分散処理対応後[PCサーバ PRIMERGY×1台(16コア)追加]:7分間(約12分の1)
  • 並列分散処理対応後[PCサーバ PRIMERGY×2台(32コア)追加]:4分間(約21分の1)

流通分野のベンチマークテストは、過去の売上データから店舗別、商品別の需要予測するシミュレーションを、今回100店舗における1,000商品の需要予測を行い、需要予測の精度向上のために複数のシミュレーション手法を用いて予測した。

その結果、100店舗、それぞれ1,000商品の需要予測計算所要時間は次のとおりとなった。

  • 並列分散処理対応前:45時間
  • 並列分散処理対応後[PCサーバ PRIMERGY×1台(16コア)追加]:4時間(約11分の1)
  • 並列分散処理対応後[PCサーバ PRIMERGY×2台(32コア)追加]:2時間(約19分の1)

結果の詳細については、PCクラスタ性能検証結果に掲載。富士通はHPCの高速処理技術のビッグデータ領域への適用を目指し、今後も引き続き性能検証を実施し、結果を公開していく。