Hot Chips 27 - メッシュネットワークでコアをつなぐKnights Landing(2) KNLは高バンド幅のMCDRAMを1パッケージに搭載

コアは2命令並列のOut-of-Order+2個の512bit VPU

KNLのコアは2命令並列のデコード、リネーム、リタイアを行うOut-of-Order(O-o-O)実行コアであり、4スレッドを並列に実行することができる。2命令のO-o-Oという比較的簡素な設計であるが、4スレッドをSMTで実行することでデータ依存による実行制約を減らすという上手いチョイスとなっている。

D-Cacheは32KB 8Wayであり、512bitのデータの2つの読み出しと、1つの書き込みを同時に行えるようになっている。演算器は512bit幅のベクトルALUを2組装備している。

コアとVPUのブロックダイヤ

各コアは4スレッドを並列に実行するSMT(Simultaneous Multi-Threading)方式であり、ROB(ReOrder Buffer)、リネームバッファ、RS(Reservation Station)はダイナミックにスレッドごとにエントリを分割して使用される。一方、キャッシュやTLBはすべてのスレッドが共有することになる。このため、1スレッドしか実行していない場合でも、実行中のスレッドが全部の資源を使うことができる。

次のブロック図で★のついている部分はスレッドを選択している部分を示す。その他の部分はその命令がどのスレッドに属するかを意識することなく処理を行っている。

各コアは4スレッドを同時並列的に実行するが、★のついている部分はスレッドを選択して実行する

KNLはHaswellと命令互換

KNLはAVX2命令を含み、Haswell CPUと同じ命令を実行することができるが、唯一の例外はトランザクショナルメモリを実現するTSX命令で、これはサポートしてない。KNLでTSX命令を必要とするトランザクション処理を実行することは、Intelとしては想定していないようである。

そして、KNLでは512bit長のベクトルデータをマスク付きで演算するAVX-512命令がサポートされている。AVX-512命令の中には、通常の演算以外に、指数関数や逆数を計算するAVX-512ER命令や、ベクトルのプリフェッチを行うAVX-512PF命令などが含まれている。

配列を扱うループでは、ある回のループの演算結果を後の回のループが入力として使うような計算が含まれていることがある。しかし、後の回の入力データを前の回の演算結果の格納する以前に読んでしまうようなベクトル化が行われると、正しい結果が得られなくなってしまう。KNLでは、このような問題を生じる可能性があるデータ参照を検出するAVX-512CD(Conflict Detection)という命令があり、その部分をマスクして問題の無い部分だけを効率的にベクトル化することができるようになっている。

KNLは、TSX命令を除いて、Xeonと同じ命令を実行する。これに加えてAVX-512命令をサポートしている

高バンド幅のMCDRAMを同一パッケージに搭載

KNLでは、MCDRAMという3D積層の高バンド幅のメモリをプロセサチップと同一のパッケージに搭載してメモリバンド幅を大きく引き上げている。そして、最大384GBのDDR4 DIMMと16GBのMCDRAMがプロセサチップに接続されることになるが、その使い方には、次の図のような3つの形態がある。

その第1は、MCDRAMをDDR DRAMのキャッシュとして使うという方法である。MCDRAMのキャッシュのヒット率が高ければ、全部が高バンド幅のメモリのように使える。第2の方法は、MCDRAMとDDR DRAMを別アドレスのメモリとして使うという方法である。この場合は、変数をMCDRAMの領域に置けば高バンド幅、高バンド幅を必要としないデータはDDR DRAMの領域に置くというソフトウェアによる最適化ができる。

第3の方法は、MCDRAMの一部をキャッシュとして使い、残りはDDR DRAMとは別のアドレスに置くというハイブリッド方式の使い方である。アクセス頻度が高く、常に高バンド幅が必要なデータはMCDRAM側のアドレスに置き、その他のデータはDDRメモリのアドレスに置いてMCDRAMのキャッシュ効果を利用するという方法で、Intelとしては、この使い方が多く使われると見ている。

KNLではMCDRAMの使い方として3つのモードがある

(次回は9月8日に掲載します)

KNLは高バンド幅のMCDRAMを1パッケージに搭載

コアは2命令並列のOut-of-Order+2個の512bit VPU

KNLはHaswellと命令互換

高バンド幅のMCDRAMを同一パッケージに搭載

この連載の前後回

Members+ 会員限定記事

業務フローを変革し働き方まで刷新した富山県立中央病院、その手法とは

生成AIで大きく変わるOMOと顧客体験

リボン・コミュニケーションズ、事業戦略を説明 - IP＆光伝送製品市場で成長を

スマホとZoom Phoneの導入で大丸松坂屋百貨店に起きた「現場のコミュニケーション改革」

サンレディースがデータ活用の組織文化の醸成に成功したポイントとは？

ワークロードに最適なクエリエンジンを選択できる「watsonx.data」の最新機能

編集部が選ぶ関連記事

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」第1回 3種類の製品形態での提供が計画されている次世代Xeon Phi

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」第2回 3D積層メモリ「MCDRAM」との1パッケージ化でメモリバンド幅を大幅に向上

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」第3回 DDRとMCDRAMの2種類のメモリを使い分けできるKNL

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」第4回スカラとベクトル両方の性能向上を目論む今後のXeon Phiの方向性

関連リンク

東北大、半導体とスピン素子による融合型確率論的コンピュータの性能を実証

ソフトバンクと理研が進める量子・スパコン連携は社会に何をもたらすのか？

36個のLSIによるスケーラブル全結合型イジングプロセッシングシステム、理科大が実機検証に成功

IBM Research本部のYorktown Heightsから見る、量子コンピュータの最前線

Cerebras、4兆トランジスタを搭載した第3世代WSE「WSE-3」を発表

早大など、組合わせ最適化問題を現在の量子計算機で高精度に解く手法を開発

このカテゴリーについて

KNLは高バンド幅のMCDRAMを1パッケージに搭載

コアは2命令並列のOut-of-Order+2個の512bit VPU

KNLはHaswellと命令互換

高バンド幅のMCDRAMを同一パッケージに搭載

この連載の前後回

Members+ 会員限定記事

業務フローを変革し働き方まで刷新した富山県立中央病院、その手法とは

生成AIで大きく変わるOMOと顧客体験

リボン・コミュニケーションズ、事業戦略を説明 - IP＆光伝送製品市場で成長を

スマホとZoom Phoneの導入で大丸松坂屋百貨店に起きた「現場のコミュニケーション改革」

サンレディースがデータ活用の組織文化の醸成に成功したポイントとは？

ワークロードに最適なクエリエンジンを選択できる「watsonx.data」の最新機能

編集部が選ぶ関連記事

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」 第1回 3種類の製品形態での提供が計画されている次世代Xeon Phi

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」 第2回 3D積層メモリ「MCDRAM」との1パッケージ化でメモリバンド幅を大幅に向上

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」 第3回 DDRとMCDRAMの2種類のメモリを使い分けできるKNL

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」 第4回 スカラとベクトル両方の性能向上を目論む今後のXeon Phiの方向性

関連リンク

東北大、半導体とスピン素子による融合型確率論的コンピュータの性能を実証

ソフトバンクと理研が進める量子・スパコン連携は社会に何をもたらすのか？

36個のLSIによるスケーラブル全結合型イジングプロセッシングシステム、理科大が実機検証に成功

IBM Research本部のYorktown Heightsから見る、量子コンピュータの最前線

Cerebras、4兆トランジスタを搭載した第3世代WSE「WSE-3」を発表

早大など、組合わせ最適化問題を現在の量子計算機で高精度に解く手法を開発

このカテゴリーについて

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」第1回 3種類の製品形態での提供が計画されている次世代Xeon Phi

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」第2回 3D積層メモリ「MCDRAM」との1パッケージ化でメモリバンド幅を大幅に向上

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」第3回 DDRとMCDRAMの2種類のメモリを使い分けできるKNL

ISC 2015 - Intelが語った次世代Xeon Phi「Knights Landing」第4回スカラとベクトル両方の性能向上を目論む今後のXeon Phiの方向性