まとめと考察

ということでSkylake(と、併せてBroadwell)の内部構造に関し、SandraとRMMAを利用して確認してみた。ここから分かることは

  • Broadwellは、TLB周りなどは大幅にHaswellから変更されており、かつTSX命令の完全な実装が成されていることは確認されたが、後の相違点はL4の存在のみである。GPUに関してはEU数の増加と同じくL4の存在により、大幅に性能改善が実現できている。
  • Skylakeは、基本的なパイプライン構造はBroadwellからあまり変わらない。大きな変更がありそうなのはL2/L3キャッシュの帯域、それとDecoded μOps Cache周りのみと思われる。TLB周りにも変更が見られるほか、Decode周りは一部性能を落としている部分もあるが、これはむしろトランジスタ数と性能のバーターではないかと思われる。
  • GPUに関しては、確かにHaswellよりは性能が高いが、メモリアクセスに足を引っ張られているようでBroadwellには及ばない。

ということになる。もっともL4に関しては、今回リリースされたSkylake-SことCore i7-6700K(やCore i5-6600K)はオーバークロックを前提にした高動作周波数モデルであり、eDRAMを追加するとむしろオーバークロックの妨げになるから外したという面もある。

いずれはeDRAM搭載のSkylakeもラインナップされる(それがDesktop向けにどこまで出るか、はまた別の問題だが)だろうから、あまり深刻な問題ではないのだろうが、ただeDRAMでも積まない限り性能が頭打ちになる、という傾向は見て取れる。

このあたりは、実質的に利用できるメモリ帯域(と価格)がより低いGodavariが、その割りに健闘している事を考えると、まだ工夫の余地があるというか、もう少しなんとかできないものかという気はする。

とはいえ、Skylakeはフロントエンドのその外側を、さらに強化するという方向で性能改善を行ったことはよく分かった。問題はそれにも関わらず、LINPACKなど一部のテストでは、むしろ性能が落ちているケースがあることだ。これに関するヒントは今回のベンチマークの分析からは得ることができなかった。このあたり、詳細が説明される機会があることを期待したい。