完全版!! 「Core i7」極限検証 - 内部アーキテクチャ解析編

そんな訳で、色々と細かな変更が図られているデコード段であるが、そうなるとUtil29なんかどうなるか? ということでちょっと試してみた。Util29の説明はこちらに詳しいが、Core MA上で最大5命令/cycleで動くプログラムと、これを改変したプログラムから構成されている。

さて、これを実施した結果がグラフ20である。まず明らかなことは、もはやCore MA向けに最適化されたプログラムは、Nehalem MAでは最適ではないことだ。Test1は、Core MAでは1cycleで動くものであり、これが1.8cycle程度掛かっている(2cycleにならないのは、17Bytes/cycleの帯域のお陰か、Complex Decoderの分か、どちらかと思われる)時点で、従来利用できたMacroOps Fusionの組み合わせ方が変化したと考えざるを得ない。ただ、逆にTest2とかTest4/Test6では微妙に高速化しているあたり、全てが完全に変わった、という訳でもない。どうもこのあたりは、LSDをデコード段の後ろに持ってきた事が関係しているようだ。

完全版!! 「Core i7」極限検証 - 内部アーキテクチャ解析編

目次

編集部が選ぶ関連記事

完全版!! 「Core i7」極限検証 - 総合性能プレビュー編

完全版!! 「Core i7」極限検証 - 詳細性能ベンチマーク編

関連キーワード

「Unreal Engine 5.4」が登場 - 独自の超解像技術「Temporal Super Resolution」も改良

今週の秋葉原情報 - 背面コネクタ仕様のマザーボードが発売に、対応ミドルタワーも早速登場

Intel Arc向け最新グラフィックスドライバ「31.0.101.5444」公開 - DX11ゲームで11%前後性能上昇

ドスパラ、5月18日と19日の12時から全国31店舗で『自作パソコン組立イベント』を開催

「Qualcomm Snapdragon X」シリーズが4月24日発表？ QualcommのノートPC向け製品、公式Xが予告

『Ghost of Tsushima Director’s Cut』PC版の推奨構成が判明 - なんとPSNのトロフィーも取得できる

このカテゴリーについて