その次のAcademiaのセッションでは、

Session3 Academia

  • 1. HALO: A Flexible and Low Power Processing Fabric for Brain-Computer Interfaces
  • 2. Kraken: A Direct Event/Frame-Based Multi-sensor Fusion SoC for Ultra-Efficient Visual Processing in Nano-UAVs
  • 3. Amber: Coarse-Grained Reconfigurable Array-Based SoC for Dense Linear Algebra Acceleration
  • 4. Arm Morello Evaluation Platform - Validating CHERI-based Security in a High-performance System

という4つの論文が発表される。

学会2日目はMachine Learningのセッション4で幕を開ける。

Session 4 Machine Learning

  • 1. Groq Software-Defined Scale-out Tensor Streaming Multi-Processor
  • 2. Boqueria - Next Generation At-Memory Inference Acceleration Device with 1,000+ RISC-V cores
  • 3. DOJO: The Microarchitecture of Tesla's Exa-Scale Computer
  • 4. DOJO - Super-Compute System Scaling for ML Training
  • 5. Cerebras Architecture Deep Dive: First Look Inside the HW/SW Co-Design for Deep Learning

このセッションではGroq社が同社のSoftware-Defined のScale-out Tensor Streaming Multi-Processorという論文を発表する。同社はAt-Memory Computeと呼ぶ手法でデータ移動に費やすエネルギーを大幅に削減するという。Groqは2019年にプロセサチップを発表しているので、その後の進捗に注目である。

そして、Untether AI社がBoqueriaと呼ぶ次世代の推論アクセラレータを発表する。演算器として1,000+ RISC-V cores使っているという。その次にTeslaがDOJOという大型のアクセラレータの論文を2つ発表する。自動運転の学習はAIシミュレーションを使って行うのが一般的になってきており、道場(DOJO)で実戦をシミュレーションして、自動運転の学習を行うという命名とのことである。論文はハードウェアのアーキテクチャを説明するものと、MLトレーニングに関するものの2つに分かれている。

マシンラーニングのセッションの最後は、CerebrasのアーキテクチャのDeep Diveの論文である。CerebrasのCS-2ウェハレベルアクセラレータに関してはWhite Paperなどが公表されているが、それより詳しいDeep Diveの説明とのことで、注目である。

その次はNetwork and Switchesのセッションで

Session 5 Network and Switches

  • 1. AMD 400G SmartNIC SOC
  • 2. Juniper's Express 5: A 28.8Tbps Network Routing ASIC and Variations
  • 3. NVLink-Network Switch - NVIDIA's Switch Chip for High Communication-Bandwidth SuperPODs

で、AMD、Juniper、NVIDIAの3社からネットワークスイッチの論文が発表される。

続いて、Tesla MotorsのGanesh Venkataramanan氏がBeyond Compute - Enabling AI through System Integrationと題する基調講演を行う。同氏はTeslaのAutopilotの開発責任者である。

その次はADAS and Graceというセッションで、両者を同一のセッションに入れるのは変であるが、時間の都合でこのようなプログラムとなったと思われる。

Session 6 ADAS and Grace

  • 1. NVIDIA's Orin System-on-Chip
  • 2. NODAR 3D Vision System: Enabling Mass Production of Autonomous Vehicles
  • 3. NVIDIA's Grace CPU

NVIDIAの自動運転用のOrin SoCがOrin System-on-Chipというタイトルの論文で発表される。また、3D Visionシステムを開発するNODAR社がNODAR 3D Vision Systemを使えば自動運転車の大量生産が可能という論文を発表する。

そして、このセッションの最後にNVIDIAがGrace CPUの論文を発表する。NVIDIAのGrace CPUとHopper GPUはすでに発表されており、今回の発表ではこれまでの論文よりも深い発表が行われることを期待したい。

最後のセッションはMobile & Edge Processorsというセッションである。

Session 7 Mobile & Edge Processors

  • 1. AMD Ryzen 6000 Series Processor
  • 2. Meteorlake and Arrowlake : Intel Next Gen 3D Client Architecture Platform with Foveros
  • 3. Dimensity 9000 – A Flagship SmartPhone SoC
  • 4. Next-Generation Intel processor build for the edge - Intel Xeon D 2700 & 1700

このセッションでは、AMD Ryzen 6000 Series Processorという論文とIntelのMeteorlakeとArrowlakeというプロセサの論文が発表される。

また、台湾のMedia TekがDimensity 9000というスマートフォン用の主力プロセサの論文を発表する。そして、Intelの次世代エッジプロセサであるIntel Xeon D2700とXeon D1700というエッジプロセサの発表が行われる。これが今回のHot Chips 34を締めくくる発表になる。