早くも展示されていたIntel Data Center GPU Flex 170

2022年10月26~28日まで幕張メッセで行われていた第三回 AI・人工知能EXPO秋に行ったところ、インテルブースが採用企業と共に説明をおこなってました。

「GeTiの学習デモ見たいけどInovation 2022で出てきたばかりの展示はさすがにムリだよなぁ)」と思って覗き込んだところIntel Data Center GPU Flex 170と思しきボードが展示されていました。

  • Intel Data Center GPU Flex 170を初展示? ここで「Xe」って何かを整理してみました

    RX Japan主催の第三回AI・人工知能EXPO【秋】のインテルブース。写真中央奥のIntelロゴの下でOpenVINOの説明と共に置かれていたのが……

  • Intel Data Center GPU Flex 170と思しきボード

ボード単体の展示で通電されていないのでモックアップかもしれませんが、GPUと大きくプリントされていない以外はInovation 2022で紹介されたIntel Data Center GPU Flex Seriesのように思えます。説明員は「(正式名称は知らないが)TDP150W動作のDG2を搭載したGPU」と紹介していました。

説明員が意図的に説明しなかったのかどうかわかりませんが、これまでの発表を組み合わせると、「TDP150W動作のDG2を搭載したGPU」はIntel Data Center GPU Flex 170で間違いないようです。インテルのサイトでは出荷中となっているのですが、日本市場でまだ販売されていないのかもしれません。

現在インテルは汎用GPUの製品「Intel Xe」を大きく拡充しつつあります。4つの製品ジャンルのうち3つに具体的な製品の発表と出荷が行われているので、ここではIntel Xeの全体の紹介、特にXe HPCを多めに解説します。

  • Inovation 2022のDay.1 KeynoteでPat氏が持っていたものよりも地味な外見ですが、画像加工してよくよく見ると「ARCTIC SOUND ACCELERATOR」と書かれているので間違いないでしょう(Xeの開発コードはARCTIC SOUND)

そもそも、Intel Xeとは?

Intel Xeとは何か? というと、(事実上)CPU内蔵グラフィックスしか出していなかったインテルが大きく刷新したグラフィックスアーキテクチャです。

1998年2月にIntel 740というグラフィックスカードを発表して以来、デスクトップ外付け用カードはIntel Xeの製品の一つであるIntel ARC A310/380まで通常に市販されることはありませんでした。Inovation 2022で発表された上位グレードのA750も原稿執筆中にアキバに並んだようで、帰ってきたGPUボードベンダーという感があります。

Intel Xeは単なるクライアントPCの出力用としてのグラフィックスからデータセンターやスパコンにまで領域を大きく広げています。

CPU内蔵グラフィックスというと、従来は「普段使いにはいいけれども、ゲームには遅くて向かない」ものでした。最近は徐々に性能を上げつつあり「AAAタイトル(≒開発/宣伝費用を目いっぱいかけた大作ゲーム)でFHD 60FPS達成」のレベルにまで届きつつあります。通常のユーザーはFHD 60Hzの表示パネルなので、これで十分です。とは言ってもタイトルによっては画質を最低まで落としても60FPSにならないものもありますし、処理の重い高画質設定は望めません。

よりパソコンで快適なゲーム環境を求めるユーザーは「ゲーミング〇〇」のような高価なパーツを使うことになります(スコア向上を狙うゴルファーが高いゴルフ用品を買うようなものです。ゲーミング液晶と言えばコスパ優先でもFHDで144Hz、最近ならFHD 240Hzや360Hzや4K 144Hzという製品もあります)。

現在の外付けグラフィックスカード市場は基本的にゲーマー向けの中~高性能製品のみとなってしまいました(普通の人は内蔵グラフィックスで十分なので、安価な外付けグラフィックスカード市場はすでに崩壊しており、せいぜい表示枚数を増やすためのUSB接続製品があるぐらいです)。

他にも高性能GPUを必要としている市場があります。一つはいわゆるスパコン。かつては専用設計のプロセッサを使うことが多かったのですが、21世紀に入りインテルやAMDのような汎用プロセッサを組み合わせたシステムが増えました。

さらにアクセラレーターとしてGPUを汎用計算に使う動きが出て、2008年には東工大から世界初のGPUスパコンTSUBAME 1.2が登場しました。スパコンほどのパワーは必要なくても演算アクセレレーターとして、あるいはDVIやクラウドゲーミングとしてのGPUも求められています。

また今後、社会のあらゆるところで機械学習を活用するならば、学習用の高速演算が求められます。未来のコンピューティングにはベクトル演算とマトリックス演算を超広帯域幅のメモリーが必要になるのですが、現在のGPUはそれを実現しているのです。

ということで、インテルは現在Intel Xeに対して目的に応じた4つのラインナップを考えて……いました。

Xe LP(Low Power)

ローエンド製品でCPU内蔵グラフィックスの一番良い製品を単独にしたものと思えばよいでしょう(過去記事にもあるようにTiger Lake世代のIris Xeの最上位製品とほぼ変わらない構成)。

GPUを単独にすることでグラフィックスに必要な大量のメモリ帯域をCPUと奪いあうことなく利用できます。また単独製品で放熱も単独となる事から動作クロックも引き上げられています。

現時点では開発コードDG1を使用したIntel Xe MAXが2020年10月31日に発表され、基本的には「ちょっと良いノートパソコン」に採用されるものなので、基本的にデスクトップ用ボードとしての販売はありません。現在出荷されているIntel Xe MAXはIntel 10nmプロセスで製造されています。

他にもAndroidクラウドゲーミングやメディアのトランスコード/エンコード用にサーバー向けのSG1もあり、SG1 4つを一つのボードに収めた製品も出荷されています(ニュースリリース)

  • 現在のXe LPは16の実行ユニット(EU)を束ねたXe Subsliceを6つ使用しており、それとは別にMEDIA ENGINEを搭載。ブロック図はoneAPI GPU Optimization Guideより

Xe HPC(High Performance Computing)

スパコン向けの最上位アーキテクチャとなるのがXe HPCで、Ponte Vecchioのコードネームで知られていたものをIntel Data Center GPUとしてファーストカスタマーであるアルゴンヌ国立研究所へ出荷開始したことを発表しています。

ディープラーニングの学習・推論をターゲットにするため、Xe coreの構成内容も変更されています。最大構成のIntel Data Center GPUは47のシリコンチップが一つのパッケージ内に組み込まれており、コンピュートのチップはTSMC製、ベースチップはIntel 7で製造されたもの、総計47チップをパッケージ内に縦横ギッシリと並べた構造となっています。

Xe Coreの作りもXe HPGと大きく異なり、Vector Engine/Matrix Engine共に8個と半減させる代わりにVector Engineは512bit長、Matrix Engineが4096bit長とワイド化。このXe coreを128束ねたものが一基のXe HPCとなっています。

  • Xe HPCの場合はXe-Coreは8つ。ただしVector Engine、XMX Engine共に幅が拡張されており、Xe-Sliceも16個に増えてます。ブロック図はoneAPI GPU Optimization Guideより

  • 当初2021年には出荷開始されていたはずでしたが、ようやく出荷開始ということで、今年中にAuroraがフル稼働するのかしら? という気も。画像はIntel newsroomより

Xe HP

立ち位置的にはサーバー向けの上位製品ですが、今のところ具体的な製品はなく、昨年の責任者のTweetでは「Xe HPを商業的に製品化する予定はなく、Developer Cloud上のみ存在」と、実際の製品に関してはHPGとHPCで対応するようです。

モバイルからサーバーまで幅広く活躍するXe HPG

Xe HPG(High Performance Graphics)

高機能グラフィックスカード製品に属するのがこのセグメントで、現時点ではIntel ARC Aシリーズという製品名がついています。Xe LPに比べて構成が大きいだけでなく、レイトレーシング用のユニットや動画のハードウェアエンコーダーもVP9、AV1、H.264、H.265と幅広く対応。

  • Xe HPGはVector EngineとXMX Engineを各16、512KBのL1 CacheをまとめたXe-Coreが基本ブロック。この画像には載っていませんがXe-Core毎にレイトレーシング用のユニットも入ります。画像は3月に行われた最新のグラフィックス製品に関するオンライン記者説明会の資料より

  • Xe HPGのベクターエンジンは256bit SIMDで、FP16/FP32をクロック当たり32/16同時処理可能

  • Xe HPGのマトリックスエンジンは1024bit幅の浮動小数点数行列積和算演算器でFP16/BF16をクロック当たり128同時処理可能。FP16/BF16/INT8/INT4/INT2をサポート

  • それぞれのXe-CoreにRTU(Ray Tracing Unit)とTCUを付けたものを4個まとめたのがXe-Slice

  • 第一世代Xe HPGは最大8つのXe-Sliceまで拡張可能で、A380は2、A550Mで4、A750で7、A770だと8のXe-Sliceを搭載します(ローエンド製品は例外がありA310/A350MはXe-Sliceが3)

  • XeメディアエンジンはVP9/AVC/HEVC/AV1のハードウェアエンコーダーを内蔵

現在、Xe HPGにはACM-G10/ACM-G11と呼ばれる二種類のシリコンチップがあり、ARC A300シリーズはACM-G11を使用し、上位のACM-G10を使用したものがARC A700シリーズとして出荷されています。Xe LPのDG1/SG1はIntelの工場で製造されていますがACM-G10/ACM-G11はTSMCで製造されているというのもユニークなところ。末尾にMが付いたモバイル用製品もあり、ARC A500シリーズも用意されていることが分かります。

  • 第一世代のXe HPGはACM-G10とACM-G11と言う二つのシリコンが用意されACM-G10がXe-Sliceを8個までフルに搭載し、ACM-G11は2個でメモリ幅も低いかわり、XeメディアエンジンやXeディスプレイエンジンは同じです

  • 2022年3月の資料なのでモバイル製品のみの発表でしたが、Intel ARC製品は3/5/7の3カテゴリで発表されていることが分かります(デスクトップ版のA580は今のところ製品リストに含まれていません)

少々毛色が変わりますが、デザイン系アプリケーションを使用する場合にISV認証の取れたグラフィックス製品が必要になります(他メーカーだとNVIDIAのQuadroやAMDのAMD Radeon Proが該当します)。インテルもIntel Arc Proグラフィックスカードがそれに該当し、現在A30M、A40、A50が出荷中となっています。これらはすべてACM-G11で搭載メモリーの量とTDPで差を付けています。

Xe HPGは高機能グラフィックスカードだけでなく、データセンター向けGPU「Intel Data Center GPU Flex Series」にも使われています(Inovation 2022に先立って発表されました)。

現在Intel Data Center GPU Flex 140/同170の二製品が発表されており、Flex 140はACM-G11を二個使っており、Flex 170はACM-G10を搭載した製品です。Intel ARCと同じXe HPCアーキテクチャーでグラフィックレンダリング能力を持っているので、クラウドゲーミングやDVIとしての利用にも対応し、前述のとおりハードウェアエンコーダーも備えているので様々な用途に対応できるサーバー向け汎用GPUとなっています。

なお、Flex 140は二個のACM-G11が搭載されておりTDP75W、一方コンシューマー向けのARC A380は一つのACM-G11でTDP75Wです。

ハテ? と思ったのですが、データセンター用GPUは「利用比率が高く保証期間も長い」こともあり、動作クロックが抑えめにして消費電力を抑えていると思われます。

同様にA770のTDPは225W、Flex 170のTDPは150Wとなっています。

  • Intel Data Center GPU Flex Series発表前の2022年6月のインテル Tech Talkのプレゼン資料から。開発コードのArctic Sound Mとして紹介されていますが、注目は右側のTDP75W製品が2つのチップを目立たせている事。クロックを落とすだけで消費電力半減は無理があるので、低い動作電圧でも動作する選別品を使用している可能性もあるでしょう

  • 現在のXe HPGに使われているチップの開発コードはAlchemist。すでに次のBattlemageの開発にも着手しており、Celestial、DruidとABC順の開発コードになっているので、製品名もARC Axxx、ARC Bxxx、ARC Cxxxと続く感じ。画像はintel architecture day 2021のプレゼン資料

ということで、Xe LPはノートパソコンにおけるCPU/GPUの分離による熱設計の平易化と高性能化、Xe HPCがスパコン向けの超ハイエンドに対し、Xe HPGはモバイルからクラウドまで幅広い守備範囲を持つため、少なくても数の面では最も出荷されそうな感じです。