【レポート】
Intel Developer Forum Springで発表されたCoreアーキテクチャのサーバチップであるXeon 5160の性能ベンチマークが、Intelのウェブサイトで公表された。
Intelの全ての公表結果を纏めると、次の表のようになる。
| Xeon 5160 3GHz、4MB L2$ 1333FSB |
Xeon 5080 3.73GHz、2MBx2 L2$ 1066 FSB |
Opteron 285 2.6GHz |
Xeon 5160 / Xeon 5080 | |
|---|---|---|---|---|
| SPECint_base2000 | 3,012 | 1,764 | 1,714 | 1.71 |
| SPECfp_base2000 | 2,602 | 1,880 | 1,731 | 1.38 |
| SPECint_rate_base2000 | 123 | 81.2 | 76.4 | 1.51 |
| SPECfp_rate_base2000 | 83 | 66.4 | 72.9 | 1.25 |
| TPC-C | 169,360 | 125,954 | 113,628 | 1.34 |
| SAP SD 2tier | 1,200 | 1,047 | 995 | 1.15 |
| SPECjbb2005 | 96,404 | 64,288 | 57,490 | 1.50 |
| SPECweb2005 | 9,182 | 6,400 | 1.43 | |
| MMB3 (MS Exchange) | 13,500 | 12,900 | 12,008 | 1.05 |
| R6iNotes (Lotus Notes) | 18,101 | 13,927 | NA |
SPECxxというベンチマークは、Standard Performance Evaluation Corporationという業界団体が定めているベンチマークで、プロセサの性能比較としては一番広く用いられている。SPECint_base2000というベンチマークは、整数演算を中心とする12種のベンチマークプログラムからなっており、プログラム毎に基準システム(250MHz程度のUltraSPARC 1)の実行時間をテストするシステムの実行時間で割った値を求め、それらの幾何平均を取った値を100倍したものである。また、SPECint_rateとrateが付いている方は、システム内の全プロセサでSPECintのプログラムを並列に動作させて総合スループットを測るのであるが、rateなしの方は、基本的に1個のプロセサコアだけで実行される。
プロセサの性能はハードウェアだけでなく、コンパイラの最適化によっても変ってくる。そのため、全12種のプログラムを同一のコンパイラオプションを指定してコンパイルして測定した値はbaseを付け、プログラム毎に最適のコンパイルオプションを選ぶというやり方の測定はbaseをつけず、ベース値に対してピーク値と呼ばれる。
最近のプロセサは内蔵するキャッシュが大容量化し、SPECintのプログラムの大部分はキャッシュに収まり、殆ど、CPUコアの整数演算プログラムの処理性能が見えると言われている。
このSPECintベンチマークでWoodcrestは3012という値を叩き出している。この値はFujitsu SiemensのPRIMERGY RX200 S3サーバの値と書かれているが、この値はSPECには、まだ登録されておらず、フライングの公表である。しかし、DELLのPrecision Workstation 690の結果は登録済みであり、こちらは若干高い3057である。
この値がどれくらい凄いかというと、SPECの登録値をサーベイしてみても、Opteronの値は1837が最高であり、2.2GHzのIBMのPOWER5+が1705、1.6GHzのItanium 2が1590、富士通の2.16GHzのSPARC64 Vが1501、Sunの1.6GHzのUltraSPARC 3iに到っては734しか出ていない。つまり、他のプロセサの2倍近い高性能である。
Coreアーキテクチャでは、従来、3命令並列のデコード、実行パイプラインを4命令並列と33%増強し、マクロフュージョンで比較と条件分岐命令を結合して5命令を4命令に実行命令数を削減しているなどのアーキテクチャ上の改善が効いているものと思われる。整数プログラムでは5命令に1回程度は条件分岐命令が出てくるので、大雑把にはこれで25%性能が改善でき、同時実行命令数の33%増と合わせると、計算上は70%近い性能向上となる。
また、依存関係にない後続のロード命令を先に実行してしまうSmart Memory Accessも平均メモリアクセスレーテンシを短縮し、ある程度の性能改善が見込めるし、2コアで共通の2次キャッシュも、SPECintは1個のコアだけしか動かさないので、コアごとに2次キャッシュがくくりつけになっているXeon 5080では2MBのキャッシュしか使えないが、Woodcrestでは4MBのキャッシュを1コアで占有できるという点で高性能に寄与している筈である。ということで、Coreアーキのベースとなった3.0GHzのYonahアーキと、3.73GHzのPentium 4(Netburst)アーキが同程度の性能とすると、CoreアーキのXeon 5160 がPentium 4アーキのXeon 5080より71%高いSPECint_base2000性能を達成していることは、おおよそ説明できると思われる。
| アジレント、ミリ波信号解析ソリューションを発表 [16:54 5/24] |
| NXP、独自のTrench 6テクノロジによる車載用パワーMOSFETファミリを発表 [16:52 5/24] |
| 産総研、光照射で損傷を自己修復できるゲル状スマートマテリアルを開発 [16:49 5/24] |
| アンテナ設置数が半分の33台に到達 - アルマ望遠鏡、2kmの干渉試験も成功 [16:45 5/24] |
| 人工知能実現へ一歩前進!? - NIMS、環境依存型「シナプス素子」を開発 [16:40 5/24] |
|
【連載】これだけは要チェック! TOEIC(R)単語帳 第95回 今回のお題は…「substitute A for B」 [17:00 5/24] キャリア |
|
ケシャ、ニュー・アルバムでブラーの"ソング2"をサンプリング [17:00 5/24] エンタメ |
|
「40歳以上で独身なら結婚諦める」が過半数 - 新入社員に聞く結婚観 [16:55 5/24] ライフ |
|
アジレント、ミリ波信号解析ソリューションを発表 [16:54 5/24] エンタープライズ |
|
NXP、独自のTrench 6テクノロジによる車載用パワーMOSFETファミリを発表 [16:52 5/24] エンタープライズ |
4つの診断で、自分の適性を見つめなおそう!
働くこと・挑戦し続けることへの思いを綴ったインタビュー
あなたにピッタリのアドバイスを読むことができます。
転職に必要な情報が収集できます
企業からアプローチのメッセージが届きます。