Xilinxは6月9日、第1世代ACAPであるVersalシリーズの第4弾製品として、「Versal AI Edge」を発表した。今回、事前にこの内容を聞くことができたので、その詳細をご紹介したい。
Versalシリーズは元々2018年に開催されたXDFで明らかになったものだが、この時には「Versal AI Core」と「Versal Prime」のみが発表された。これに続き、2020年3月には「Versal Premium」が発表になっており、今回が第4弾というわけだ。
さて、Photo01だとVersal AI Edgeは名前の通りEdge向けということで処理性能を下げる方向かと思いきや、むしろ性能を上げてゆく方向に舵を切った(Photo02)。
察するに昨今のAI Edgeの用途(Photo03)は、2018年にロードマップを構築した時よりもより高い性能が要求される様になってきており、これにあわせてAI Engineの再設計を行った結果として、ロードマップから1年遅れでの投入となったのではないかと思う。
さてそのVersal AI Edgeの構成がこちら(Photo05)。2018年に発表されたVersal AI Coreと比較すると、
- 新たにPlatform Management Control、Acceelrated RAMが搭載された。
- LPDDR4にも対応
といった点がぱっと見で異なる部分だが、これに加えてAI Engineそのものにも手が入っている。
新しいAI Engineは「AI Engine-ML(AIE-ML)」とされるが、純粋に演算性能が倍増したほかINT4やBFLOAT16に対応、ローカルメモリの拡張やMemory Tileの追加などが行われている(Photo05)。その一方でDSP部はほぼそのままといった感じで、その結果として従来のVersal AI Coreと今回のVersal AI Edgeでは明確に用途が分かれた格好だ(Photo06)。
また今回から追加されたのが「Accelerator RAM」である(Photo07)。
後でProduct Tableが出てくるが、規模の小さい製品はメモリ量がそれほど多くない。これはFPGA Fablicの規模に応じてUltra RAMやBlock RAMのサイズが決まってしまうからで、なので150K LUT以下の製品についてはAI処理時のサポート用に、新しく4MBのAccelerator RAMが追加されている。
さて、肝心の性能であるが、例えばNVIDIAのJetson Xavier NXと比較した場合の性能がこちら(Photo08)。
具体的に、Level 3の自動運転に必要なシステムを構成するのに必要なシステムを見積もると、大幅に簡素化できる(Photo09)としている。
特に自動車向けには早くからISO 26262の認証を取得しているという話であった(Photo10)。
また特定の市場に向けたApplication Stackに力を入れていくとし(Photo11)、従来のDSA(Domain Specific Architecture)から一歩進んだDFX(Dynamic Function eXchange)に進むとしている(Photo12)。
Photo13がそのVersal AI EdgeのProduct Tableとなる。
DSP Unitの数とかが不明なので断言はできないが、Versal AI CoreからFPGA Fabricの量を大分減らし、その分をAIE-MLに割り当てた格好になっている。ちなみにリードデバイスとなるVE1752のみ、AIE-MLではなく従来のAI Engineを搭載している。
ちなみにVersal AI CoreとVersal AI Edgeの違いは、このAIE-MLを搭載するか否かではなく、一つは先にPhoto10で出てきたAutomotive Gradeの提供の有無(Versal AI CoreにはAutomotive Gradeの提供は無い)。もう一つはVersal AI Edgeは絶対性能ではなく性能/消費電力比に向けてチューニングされている事だそうだ。
このVersal AI Edge、開発ツールは今年後半から、サンプル出荷は2022年前半に提供予定となっている(Photo14)。
評価キットは、まずはVersal AI Coreを搭載したVCK190が提供されるので、あとでVersal AI Edgeに移行という形になる模様だ。このあたりもあって、リードデバイスはAI Engineを搭載しているのかもしれない。