情報の流れを処理するメモリファブリック
そして、メモリファブリックは各種のスライスやL3キャッシュ、Ramboキャッシュなどを接続するコヒーレントなインタコネクトである。さらに、メモリファブリックにはPCI Express、ディスプレーポート、メモリコントローラなどが接続される。そして、メモリコントローラからはDDR4やGDDR6、HBM2などのメモリが接続できる。
また、Xeリンクを通して他のXeチップに接続して複数タイルのXeシステムにすることもできる。
次の図は4個のXeタイルをEMIBブリッジ(図中の白い部分)で接続してマルチタイルのXeを作った例である。このような同一パッケージ内の複数タイルの結合は、パッケージングを行う時のオプションとして実行することができる。
XeLPは1スライスだけの低電力システムで、CPU内蔵型のGPUとして使われる場合も、CPUとは別チップのディスクリートGPUとして使われる場合もある。XeHPGはディスクリートのゲーミング用GPUなどをターゲットにしており、GDDR6メモリを使いレイトレーシングを実行するような使い方ができる。
XeHPはマシンラーニングやメディアワークステーションのような使い方を想定しており、HBM2eメモリの使用や同一パッケージに1-4タイルを接続するような使い方を想定している。
XeHPCはスパコン用で、高バンド幅のHBM2eメモリを使い、Xeリンクで複数タイルを接続する。そして、パッケージ内ではFoverosやEMIBを使って複数タイルを接続する。これに加えて小規模のシステムでは1-2タイルをパッケージに入れるという形態もあり得る。
Tiger Lake CPUの内蔵GPUとしての使用が先行
現状では、Tiger Lake CPUに搭載されるXeLPが製造中というステージにあり、一番、商品化に近い。その次がエクサスケールのAuroraスパコンに使用されるXeHPCのPonte Vecchio GPUで、これは製造中のステージにある。XeHPとXeHPGはまだ、設計部門の手を離れていない状態である。
次の図はXeLP GPUを内蔵したTiger Lake CPUのチップ写真である。GPUの面積はチップ全体の1/3程度であり、比較的小さいという印象である。これで前世代のGen 11 GPUと比べて、同一面積、同一電力で比較して、3DやComputeの性能は約2倍に向上しているという。
そして、XeLP GPUは最大96個のEUを搭載しており、これは前世代の1.5倍にあたる。また、最大48テクセル/クロック、24ピクセル/クロックのピクセル処理が可能になっており、前世代に比べて1.5倍の大きさのエンジンになっている。