Xilinxは6月9日、第1世代ACAPであるVersalシリーズの第4弾製品として、「Versal AI Edge」を発表した。今回、事前にこの内容を聞くことができたので、その詳細をご紹介したい。

Versalシリーズは元々2018年に開催されたXDFで明らかになったものだが、この時には「Versal AI Core」と「Versal Prime」のみが発表された。これに続き、2020年3月には「Versal Premium」が発表になっており、今回が第4弾というわけだ。

さて、Photo01だとVersal AI Edgeは名前の通りEdge向けということで処理性能を下げる方向かと思いきや、むしろ性能を上げてゆく方向に舵を切った(Photo02)。

  • Versal AI Edge

    Photo01:元々のロードマップではVersal Premiumと同時期にVersal AI Edgeが発表予定だったので、ちょっと遅れ気味な気も。順序で言えばこの後Versal AI RF、次いでVersal HBMになるはず

  • Versal AI Edge

    Photo02:具体的にはAI Engineの内部構造を変えるという、なかなかドラスティックな事をした

察するに昨今のAI Edgeの用途(Photo03)は、2018年にロードマップを構築した時よりもより高い性能が要求される様になってきており、これにあわせてAI Engineの再設計を行った結果として、ロードマップから1年遅れでの投入となったのではないかと思う。

  • Versal AI Edge

    Photo03:スマートビジョン位はまだしも、ADASとか自動運転まで視野に入れると、確かに性能の引き上げは必要かもしれない

  • Versal AI Edge

    Photo04:Versal Premiumで導入されたPCIe Gen5への対応とか100G超えのEthernetの対応などは見送られた。まぁEdgeには不要だからということだろう

さてそのVersal AI Edgeの構成がこちら(Photo05)。2018年に発表されたVersal AI Coreと比較すると、

  • 新たにPlatform Management Control、Acceelrated RAMが搭載された。
  • LPDDR4にも対応

といった点がぱっと見で異なる部分だが、これに加えてAI Engineそのものにも手が入っている。

  • Versal AI Edge

    Photo05:もちろんここまで変更すると旧来のAI Engineとはソフトウェア互換性が無くなるが、これに関してはVivadoとかVitisなどのツールの側でMigration Toolを用意してスムーズに移行できる様にするとの事

新しいAI Engineは「AI Engine-ML(AIE-ML)」とされるが、純粋に演算性能が倍増したほかINT4やBFLOAT16に対応、ローカルメモリの拡張やMemory Tileの追加などが行われている(Photo05)。その一方でDSP部はほぼそのままといった感じで、その結果として従来のVersal AI Coreと今回のVersal AI Edgeでは明確に用途が分かれた格好だ(Photo06)。

  • Versal AI Edge

    Photo06:ただVersal AI CoreもEdge的な用途で使われている事を考えると、ちょっとNamingには失敗したのかもしれない

また今回から追加されたのが「Accelerator RAM」である(Photo07)。

  • Versal AI Edge

    Photo07:左の図だとAI EngineおよびCortex-R用に見えるが、実際にはNOCにつながっているのでCortex-AやDSP、FPGA Fabricからもアクセス可能。Block RAMの大型版という扱いに近いかもしれない

後でProduct Tableが出てくるが、規模の小さい製品はメモリ量がそれほど多くない。これはFPGA Fablicの規模に応じてUltra RAMやBlock RAMのサイズが決まってしまうからで、なので150K LUT以下の製品についてはAI処理時のサポート用に、新しく4MBのAccelerator RAMが追加されている。

さて、肝心の性能であるが、例えばNVIDIAのJetson Xavier NXと比較した場合の性能がこちら(Photo08)。

  • Versal AI Edge

    Photo08:ただしVersal AI Edgeの方は全部異なるデバイスな事に注意。またCPUアクセラレータの性能もResNet50でやってるあたりはどうかと思う

具体的に、Level 3の自動運転に必要なシステムを構成するのに必要なシステムを見積もると、大幅に簡素化できる(Photo09)としている。

  • Versal AI Edge

    Photo09:ただ消費電力は同等、というあたりはやはりプロセスが同じで処理が同じだと、消費電力も同じあたりになるという事だろうか

特に自動車向けには早くからISO 26262の認証を取得しているという話であった(Photo10)。

  • Versal AI Edge

    Photo10:Versal AI Edgeは全製品に対してXA(Automotive Grade)が用意され、また動作温度範囲も-40℃~100℃のIndustrial向けと-40℃~125℃のAutomotive向けがあるとの事だった。ちなみに今後は自動車だけでなく、他の安全規格への対応も考えていると思われる

また特定の市場に向けたApplication Stackに力を入れていくとし(Photo11)、従来のDSA(Domain Specific Architecture)から一歩進んだDFX(Dynamic Function eXchange)に進むとしている(Photo12)。

  • Versal AI Edge

    Photo11:具体的にどんな市場向けに用意されるかはまだ不明。この3つだけということは無いと思うが

  • Versal AI Edge

    Photo12:従来のPartial Reconfigurationの進化系という格好であるが、数msという時間はやや中途半端な感じも。ブロックの内容を入れ替えながら処理を行う、いわゆるReconfiguration的な使い方には遅すぎるし、FirmwareのOTA Updateの対応だけなら無駄に高速すぎる気もする

Photo13がそのVersal AI EdgeのProduct Tableとなる。

  • Versal AI Edge

    Photo13:例えばVersal AI CoreのハイエンドであるVC1902はAI Engineを400基搭載する。一方Versal AI EdgeのハイエンドであるVE2802はAIE-MLを304基搭載しており、AIE-MLが従来のAI Engineの2倍の処理性能であることを考えると、VE2802の方が1.5倍のML処理性能を実現できる格好だ

DSP Unitの数とかが不明なので断言はできないが、Versal AI CoreからFPGA Fabricの量を大分減らし、その分をAIE-MLに割り当てた格好になっている。ちなみにリードデバイスとなるVE1752のみ、AIE-MLではなく従来のAI Engineを搭載している。

ちなみにVersal AI CoreとVersal AI Edgeの違いは、このAIE-MLを搭載するか否かではなく、一つは先にPhoto10で出てきたAutomotive Gradeの提供の有無(Versal AI CoreにはAutomotive Gradeの提供は無い)。もう一つはVersal AI Edgeは絶対性能ではなく性能/消費電力比に向けてチューニングされている事だそうだ。

このVersal AI Edge、開発ツールは今年後半から、サンプル出荷は2022年前半に提供予定となっている(Photo14)。

  • Versal AI Edge

    Photo14:ただこれはAIE-MLを搭載しないリードデバイスのVE1752の話と思われる。VE2000番台のサンプル出荷がいつ頃になるかは不明だ

評価キットは、まずはVersal AI Coreを搭載したVCK190が提供されるので、あとでVersal AI Edgeに移行という形になる模様だ。このあたりもあって、リードデバイスはAI Engineを搭載しているのかもしれない。

  • Versal AI Edge

    Photo15:ちなみにお値段は1万1995ドルである