Intel Optimized SMP LINPACK Benchmark package Version 10.3(グラフ58~59)

Intel
http://software.intel.com/

久々のLINPACKであるが、このVersion 10.3は内部で利用しているMath Kernel LibraryがAVXに対応している。ということでどこまで成績が上がるかも楽しみである。そんなわけでグラフ58が非AVX環境、グラフ59がAVX環境での比較(対象はCore i7-2600Kのみ)である。

さてまずグラフ58であるが、相変わらずHyper-Threadingを有効にするとガクンと成績が落ちることは変わらない。そんなわけでHyper-Threadingが無効なi5-2500Kが最高速であるが、これはまぁ余興のようなものである。とはいえ、Hyper-Threadingが無効なCore i5-2500Kでは20000Bytesあたりでピーク性能が出ているが、Hyper-Threadingを有効にすると4000Bytesあたりがピークというのは、搭載メモリ量が4GBとか6GBでは足りないということかもしれない。とりあえずこちらでも、Core i7-975はCore i7-2600Kに及ばないということは見て取れる。

問題はAVXを有効にしたケースだ。グラフ59がそれで、ほぼ倍以上のスループットな上、グラフの形も異なっている。おそらくこの調子ならHyper-Threadingを無効にすれば、100GFLOPSの達成は堅そうだ。グラフの形が変わるあたり、チューニングの方法はSSEまでとまた変わってくることは予想されるが、それでもHPC向けにAVXの有望さを見て取ることはできたと思う。