【レポート】

Intel Woodcrestの性能

1 SPECint

    安藤壽茂  [2006/06/06]

    Intel Developer Forum Springで発表されたCoreアーキテクチャのサーバチップであるXeon 5160の性能ベンチマークが、Intelのウェブサイトで公表された。

    整数ベンチマークのSPECint_base2000の性能比較を示す図。出典:Intelのウェブサイト

    Intelの全ての公表結果を纏めると、次の表のようになる。

    Xeon 5160
    3GHz、4MB L2$
    1333FSB
    Xeon 5080
    3.73GHz、2MBx2 L2$
    1066 FSB
    Opteron 285
    2.6GHz
    Xeon 5160 / Xeon 5080
    SPECint_base2000 3,012 1,764 1,714 1.71
    SPECfp_base2000 2,602 1,880 1,731 1.38
    SPECint_rate_base2000 123 81.2 76.4 1.51
    SPECfp_rate_base2000 83 66.4 72.9 1.25
    TPC-C 169,360 125,954 113,628 1.34
    SAP SD 2tier 1,200 1,047 995 1.15
    SPECjbb2005 96,404 64,288 57,490 1.50
    SPECweb2005 9,182 6,400 1.43
    MMB3 (MS Exchange) 13,500 12,900 12,008 1.05
    R6iNotes (Lotus Notes) 18,101 13,927 NA

    SPECxxというベンチマークは、Standard Performance Evaluation Corporationという業界団体が定めているベンチマークで、プロセサの性能比較としては一番広く用いられている。SPECint_base2000というベンチマークは、整数演算を中心とする12種のベンチマークプログラムからなっており、プログラム毎に基準システム(250MHz程度のUltraSPARC 1)の実行時間をテストするシステムの実行時間で割った値を求め、それらの幾何平均を取った値を100倍したものである。また、SPECint_rateとrateが付いている方は、システム内の全プロセサでSPECintのプログラムを並列に動作させて総合スループットを測るのであるが、rateなしの方は、基本的に1個のプロセサコアだけで実行される。

    プロセサの性能はハードウェアだけでなく、コンパイラの最適化によっても変ってくる。そのため、全12種のプログラムを同一のコンパイラオプションを指定してコンパイルして測定した値はbaseを付け、プログラム毎に最適のコンパイルオプションを選ぶというやり方の測定はbaseをつけず、ベース値に対してピーク値と呼ばれる。

    最近のプロセサは内蔵するキャッシュが大容量化し、SPECintのプログラムの大部分はキャッシュに収まり、殆ど、CPUコアの整数演算プログラムの処理性能が見えると言われている。

    このSPECintベンチマークでWoodcrestは3012という値を叩き出している。この値はFujitsu SiemensのPRIMERGY RX200 S3サーバの値と書かれているが、この値はSPECには、まだ登録されておらず、フライングの公表である。しかし、DELLのPrecision Workstation 690の結果は登録済みであり、こちらは若干高い3057である。

    この値がどれくらい凄いかというと、SPECの登録値をサーベイしてみても、Opteronの値は1837が最高であり、2.2GHzのIBMのPOWER5+が1705、1.6GHzのItanium 2が1590、富士通の2.16GHzのSPARC64 Vが1501、Sunの1.6GHzのUltraSPARC 3iに到っては734しか出ていない。つまり、他のプロセサの2倍近い高性能である。

    Coreアーキテクチャでは、従来、3命令並列のデコード、実行パイプラインを4命令並列と33%増強し、マクロフュージョンで比較と条件分岐命令を結合して5命令を4命令に実行命令数を削減しているなどのアーキテクチャ上の改善が効いているものと思われる。整数プログラムでは5命令に1回程度は条件分岐命令が出てくるので、大雑把にはこれで25%性能が改善でき、同時実行命令数の33%増と合わせると、計算上は70%近い性能向上となる。

    コアアーキテクチャの4命令並列処理の説明図。出典:IDF Spring 2006の資料

    コアアーキテクチャのマクロフュージョンの説明図。出典:IDF Spring 2006の資料

    また、依存関係にない後続のロード命令を先に実行してしまうSmart Memory Accessも平均メモリアクセスレーテンシを短縮し、ある程度の性能改善が見込めるし、2コアで共通の2次キャッシュも、SPECintは1個のコアだけしか動かさないので、コアごとに2次キャッシュがくくりつけになっているXeon 5080では2MBのキャッシュしか使えないが、Woodcrestでは4MBのキャッシュを1コアで占有できるという点で高性能に寄与している筈である。ということで、Coreアーキのベースとなった3.0GHzのYonahアーキと、3.73GHzのPentium 4(Netburst)アーキが同程度の性能とすると、CoreアーキのXeon 5160 がPentium 4アーキのXeon 5080より71%高いSPECint_base2000性能を達成していることは、おおよそ説明できると思われる。

    新着記事

    特設サイトの情報

      求人情報

      人気記事

      一覧

      イチオシ記事

      新着記事

      特別企画

      転職ノウハウ

      あなたの仕事適性診断

      4つの診断で、自分の適性を見つめなおそう!

      Heroes File ~挑戦者たち~

      働くこと・挑戦し続けることへの思いを綴ったインタビュー

      はじめての転職診断

      あなたにピッタリのアドバイスを読むことができます。

      転職Q&A

      転職に必要な情報が収集できます

      スカウト転職する

      企業からアプローチのメッセージが届きます。

      マイナビニュースマガジン