Intel Math Kernel Library Benchmark 2017.1.014(Discrete GPU)

Intel
https://software.intel.com/en-us/articles/intel-mkl-benchmarks-suite

Intel MKL(Math Kernel Library)を利用したLINPACKベンチマークだが、これまでは10.x.x.xxxとか11.x.x.xxxというバージョン番号だったのが、最新版では年号が入るように変わった。ただこの2017.1.014は2016年11月にリリースされているのだが。

さて結果はグラフ38の通りである。LINPACKの場合、Size/LDA(行列の大きさ)が大きいほど効率が上がりやすいが、Size/LDAを大きくするとその分メモリを喰うことにもなる。

今回の場合、Size/LDAがそれぞれ40000の場合がピークだが、これは搭載している32GBのメモリだと、このあたりがピークでこれを過ぎるとHDDアクセスが発生してグンと性能が落ちる(Size/LDAが45000と50000の結果を見ればこれが明白)という話である。逆に言えば、もっとメモリを積んでもう少し大きな配列を用意すれば、もうちょっとだけ性能は上がるかもしれない。

それはさておき、性能比ではこちらも明確にKabyLakeが高速な結果が出た。ただその性能差はやはり動作周波数の差そのまんま、という感じである。