なんでこんな構造になったのか、という事は容易に想像が付く。Phenom世代では、SSEの処理性能がAthlon 64 X2に比べてほぼ倍増されている(Photo03)。SSE命令のフォーマットも一般にはA×B→A(データAとデータBを取り込み、この間で行った実行結果をAに書き戻す)という形になる。ここでAの書き戻しのスピードを2倍にするためには、もともとのAとBの取り込み速度をどちらも2倍、つまり合計で4倍にしなければならない。Readが4倍速、Writeが2倍というのはこのセオリーにぴったり沿った性能改善であると思われる。

Photo03:実行帯域幅が2倍になり、当然これに伴い全ての能力が2倍以上必要になる。

これにあわせて、ということかどうかは判らないが、L2もかなり高速化されている。グラフ10、つまりReadの結果を簡単にまとめたのが表2だが、L2はCore 2 Quadと同等、L3もメモリよりは高速であり、これだけみれば十分にスピードが稼げそうな雰囲気である。WriteやCopyについてはグラフ11/12から読み取っていただきたいが、概ねCore 2 Quadと同等レベルまで性能を引き上げてきた事が判るだろう。

表2

ただ、帯域だけあげてもレイテンシが大きかったら意味がない。こちらについても同時に見てみた(グラフ13~16)。

グラフ13

グラフ14

グラフ15

グラフ16

結果から言えば、「Athlon 64 X2とCore 2 Quadの中間」といったあたりに落ち着いていることが判る。L1/L2のレイテンシは概ねCore 2 Quadと同等(微妙にL2は遅い程度)、L3は概ねAthlon 64 X2のL2並といったところ。ただトータルのキャッシュ容量の少なさは否めず、早いタイミングでメモリアクセスが発生するため、どうしてもレイテンシは大きめといった結果になっている。それでも、Athlon 64 X2と比較すると、大幅に高速化している事は間違いない。