Cool Chips 25においてXilinx(現在はAMDの子会社であるが、Xilinxという名前も継続して使っている)は「Versal AI Edge ACAP」を発表した。

この製品は商業的には2021年6月に発表されている。なお、ACAPはAdaptive Compute Acceleration Platformの略である。Versal AI Edge ACAPはAI計算に必要な高い演算性能をもつエッジ演算用の計算アレイを集積しており、FPGAの特徴であるフィールドでの配線の可変性を使っていろいろな接続のAIネットワークを作ることができる。

そして、汎用CPUで演算を行うと、計算の中間結果を格納するキャッシュやメモリを必要とするが、Versalの場合のように演算器を直結する演算器アレイを使えば、中間のメモリへの格納、読み出しの無駄を省いて効率よく計算を行うことができる。

Versal AI Edge ACAPは計算アクセラレータとして、スカラエンジン、適応型エンジン、インテリエンジンの3種のエンジンを持ち、ソフトウェア制御のオンチップネットワーク、プラットフォームマネジメントコントローラとPCIeやDDRなどの各種のインタフェースを持っている。

  • Versal AI Edge ACAPの概要

    図1 Versal AI Edge ACAPの概要。AI計算を加速する3種のエンジンとPCIeやDDRなどのIOインタフェースを持ち、ソフトウェア制御のネットワークを使って回路をつくる。汎用プロセサのようにメモリ経由でなく、直結のデータ転送を行うことができるので、効率が高い処理が行える (このレポートのすべての図はCool Chips 25でのXilinxの発表資料のコピーである)

現在、6Wから20W程度の消費電力のVE2302系列(4製品)と50Wから75WのVE2802系列(3製品)という2種類の製品系列がある。

VE2302は、INT8×4の演算で67TOPSの性能を持ち、150K個のLUTと172Mビットのメモリを持つ。また、AI Engine-ML(AIE-ML)タイルをVE2302は34個、VE2802は304個搭載している。VE2302の消費電力は15-20Wで、大型のVE2802はINT8×4の演算では479TOPSの演算性能を持ち、521K個のLUTと575Mビットのメモリを持つ。消費電力は75Wとなっている。

VE2302は8個の32Gb/sのトランシーバとPCIeのポートを持つ。VE2802は32個の32Gb/sのトランシーバとDMA付きのPCIe5.0のポートを持つ。

  • Versal AI Edge ACAPの製品系列

    図2 INT8で67TOPSのV2302と479TOPSのV2802という製品系列がある。V2302は15-20Wの消費電力であるが、V2802は75Wの消費電力になる

V2302は20W程度の消費電力であるので、M.2のようなカードに実装して使うことができる。一方、V2802は75Wと消費電力が大きいので、PCIeカードなどに搭載される。複数のV2802 を使う場合はさらに消費電力が多いので、FH3/4Lのようなカードに搭載されることになる。

  • Versal AI Edge ACAPのフォームファクタ

    図3 V2302は消費電力が15-20Wであるので、スモールフォームファクタのパッケージが使える。一方、V2802はPCIeカードなどに搭載する必要がある