2018年3月に概要が明らかにされ同8月のHotChips 30で内部構造の一端が公開された「Project Everest」こと「ACAP(Adaptive Compute Acceleration Platform)」であるが、これの採用第1弾となる「Xilinx Versalシリーズ」がXDF 2018の基調講演で公開された。

この基調講演に先立って、このVersalシリーズの概要と、若干の詳細が明らかにされたので、まとめてご紹介したい(Photo01)。

  • XilinxのKirk Saban氏

    Photo01:手前が説明を行ったKirk Saban氏(Senior Director, Product&Technical Marketing)。奥は会場のスタッフである

Versal、というかACAPはArmのプロセッサIP(Scalar Processing Engines)とFPGA Fabric(Adaptable Hardware Engine)、それに新しいS/W Programmable Engineと周辺回路から構成される(Photo02)というのは以前説明があった通り。

  • Intelligent Engineという表記

    Photo02:Intelligent Engineという表記は今回初な気がする

まずScalar Processing EngineはDual Cortex-A72とDual Cortex-R5構成となる(Photo03)。

  • Cortex-A73ではなく、A72

    Photo03:「何でCortex-A73で無かったのか?」という質問に、開発時期はそれよりも前で、当時はCortex-A72がハイエンドだった、という回答があった

ついでFPGA Fabricだが、こちらは従来よりも高いロジック実度と、より柔軟なメモリ階層構造、それとDynamic Reconfigurationを従来比で8倍高速化した、とされる(Photo04)。

  • LUTそのものの構造は同じ

    Photo04:LUTそのものの構造は基本的には同じだそうで、たとえば10LUT入力になったり、という訳ではない模様

そしてIntelligence EngineとしてはAI EngineとDSP Engineが用意される(Photo05)。ちなみにAI Engineのほうの内部構造がこちら(Photo06)となっている。

  • AI EnginesとDSP Engine

    Photo05:ここで出てきたML Vector Extentionsを搭載するのがAI Engines、5G Wireless Vector Extentisonsを搭載するのがDSP Engineということらしい。もっともDSP EngineはAI処理で利用することもあるようなので、このあたりが一対一対応していないのがまだ良くわからない部分である

  • VILW/SIMD Vector Processor Core

    Photo06:VILW/SIMD Vector Processor Coreという、冷静に考えるとさっぱり内部構造が判らない構成

Host I/FとしてはPCIe Gen4×16、AXI-DMA、それとCCIXをサポートする(Photo07)。またメモリはDDR4-3200とLPDDR4-4266、それと将来的にはHBM(HBM2と思われるが、時期的にはHVBM3の可能性もある)をサポートする(Photo08)。

  • CCIXはPCIe Gen4のPHYとMACを利用

    Photo07:CCIXはPCIe Gen4のPHYとMACを利用しつつ、その上は独自という形で実装されるため、物理的にはPCIeのPHYということになる。ただ将来的には56GのPHYも利用可能なので、実はCCIXの実装はこれらのPHYの上にかぶさる形になるのかもしれない

  • HBM搭載製品は2021年以降の投入予定

    Photo08:HBMを搭載する製品の投入は2021年以降の予定

Protocol Engineは100G Multirate Ethernetのほかに600GのEhernet/Interlakenがサポートされ、さらに600GのCryptographic Engineも搭載される(Photo09)。

  • 5G基地向け機能

    Photo09:これは間違いなく5Gの基地局向けの機能である

また32/58/112Gのトランシーバが利用可能である(Photo10)。またこれも5Gの基地局向けに、Up/Down Conversionなしで直接利用できる高速ADC/DACやDDC/DUC、さらに5G/DOCSISに対応したFEC(Forward Error Collection)なども搭載されるとする(Photo11)。

  • 高速SerDes

    Photo10:従来高速SerDesは28Gbpsだった記憶があるのだが、若干高速化されたようだ。このあたりはPCIe Gen5を睨んでいるのかもしれない

  • 複雑な5G

    Photo11:もっとも5Gも色々で、たとえば28GHz帯をそのまま直接扱うのは無理なのではないかという気もするのだが、このあたりの詳細は今後公開されると思われる

GPIO(Photo12)もMIPI D-PHYやNAND/SCM向けI/Fなどを搭載するなど、機能が充実している。最後がこうした各モジュールをつなぐネットワーク(Photo13)で、広帯域/低レイテンシと、従来のFPGAでアービトレーションを自分で行った場合と比較して8倍の電力効率を実現し、しかもプログラミングが容易とする。

  • aGPIOの概要

    Photo12:GPIOでは3.3VのLegacy I/Oもサポートするという説明もあった

  • Super Highway

    Photo13:同氏はこれを"Super Highway"と評していたが、思わず日立のSuperHに実装されたSuperHywayを連想してしまった

さて、こうした特長をもつVersalシリーズだが、第1世代はPhoto14に示す6種類の製品が用意される(Photo14)。ただ今回公開されるのはVersal AI CoreとVersal Primeの2つである。

  • Versalは6シリーズを用意

    Photo14:単純に言えば、AI Engineを搭載するのが左のAIシリーズ、持たないのが右のPrime/Premium/HBMということになるらしい

まずPrimeシリーズはミッドレンジ向けというか、いわゆる一番汎用に近い構成で、AI Engineや112GのSerDes、HBMなどは搭載しない。具体的な用途としてはレーダーのビームフォーミング向けのIntelligent Engine、Network Attach Storage(NAS)、Network Attached Accelerator、さらには通信テスト機器/データセンターのネットワーク/ストレージ/100G Ethernet/Broadcast Switch/Medical Imaging/Avionics Controlなどが挙げられている。たとえばNetwork Attached Acceleratorのケースでは、Open vSwitchを実装する場合、CPU(4コアXeon)が8.68Mpackets/secなのに対し、Versal Primeで実装すると17倍の150Mpackets/secが可能になる、という数字が示された。

  • Versalはミッドレンジ以上の製品シリーズ

    Photo15:Versalシリーズの中では事実上のローエンドであるが、これがミッドレンジということは、要するにVersalシリーズはローエンドにはそもそも入らない(最低でもミッドレンジ)という事だと思われる

一方のVersal AI Core(Photo16)の方はEdge AI Workloadに向けた構成となっており、たとえばGoogleNet V1の処理だとXeon比で43倍、GPU(Tesla V100)比で2倍の処理性能となっており、これが自動車などでの利用を前提に、レイテンシが7msとした場合はXeon比72倍、Tesla V100比で2.5倍に、さらにクリティカルなレイテンシ2msとするとTesla V100比で8倍の性能になるされる(2msの場合、CPUだと絶対に間に合わないそうだ)。また同じ消費電力(75W)にするとGPU比で4倍のスループットになる、とも説明されている。

  • 高速SerDesを省略

    Photo16:一見して高速SerDesが省かれているのが判る

ちなみにVersal AI Coreは、たとえば5Gのワイヤレスの処理にも向いており、CloudRANの制御とかSystolic Array/Baseband Processingに利用すると5倍の性能が、自己組織ネットワークの構築とかAnomaly Detection、スケジューリングなどに利用すると8倍の性能が得られるとし、ただし両立はしないのでどちらにどの程度性能を振るかを開発者が好きに調整できる、としている。

最後に製品ロードマップだが、今回発表のVersal AI CoreとVersal Primeは2019年後半に投入され、ついでVersal PrimeとVersal AI Edge/Versal AI RFが2020年中に、Versal HBMは2021年以降に投入されると説明された(Photo17)。

  • VersalHBMは2021年以降の投入

    Photo17:Versal HBMは2021年以降で、実際はもっと遅い可能性もある。この頃になると、そろそろHBM3が実用になっている気もする

さらにVersal Prime(Photo18)とVersal AI Core(Photo19)の詳細な製品SKUも今回公開されている。

  • Versal Primeシリーズの概要

    Photo18:Versal Primeシリーズの概要

  • Versal AI Coreシリーズの概要

    Photo19;Versal AI Coreシリーズの概要

今回の事前説明ではTechnical Deep Diveは後日ということで、あまり突っ込んだ話はなかった。これらについては別にレポートする予定である。