Armは5月29日、COMPUTEX TAIPEI 2023の基調講演の中でクライアント向けにCortex-X4やCortex-A720/A520、Immotalis-G720などの新たなCPU/GPU IPなどをまとめた「Total Compute Solution(TCS)」の最新版「TCS23」を発表した。まずは、基調講演前の事前説明に基づいた内容をご紹介したい。

TCS(Total Compute Solution)は以前もレポートした様に、単にCPU/GPU IPだけではなく、周辺のIPまで含めた形でハードウェアおよびソフトウェアを提供するものである。2022年に発表されたのがTCS22で、これはCortex-X3とCortex-A715/A510、それにImmortails-G715の組み合わせであった。今年発表されたTCS23では、これらのIPが大幅に刷新されることになった(Photo01)。

  • 昨年のスライドの比較

    Photo01:昨年のスライドと照らし合わせると、CXC23がCortex-X4、HunterがCortex-A720、HayesがCortex-A520、TitanがImmotalis-G720と判る

まずCPU IPであるが、トップエンドがCortex-X4で、Cortex-X3と比較して性能を15%引き上げながら40%の消費電力削減が可能とされている。もちろん、これは製造プロセスそのものも異なる(Cortex-X3は恐らくTSMC N5、Cortex-X4はTSMC N3Eでの推定値)が、IPC自身も2桁%の向上を実現する、としている。また最大で2MBまでのL2を利用できるようになった。このCortex-X4は、すでにTSMCのN3Eを利用したテストチップがTape outしているということであった。ちなみにエリアサイズはCortex-X3と比較して10%ほど増加しているとの事である。

  • 当然こちらの詳細はまだ未公開

    Photo02:当然こちらの詳細はまだ未公開

一方メインとなるCortex-A720/A520であるが、これは前世代製品(Cortex-A715/A515)と比較してそれぞれ20/22%効率が向上しているという話であった。この効率の意味だが、「同一プロセス、同一動作周波数で消費電力が減っている」の意味か? と確認したところ「同一プロセス、同一消費電力で動作周波数が向上している方だ」との説明であった。こちらも具体的なパイプライン構造などは未公表である。

  • ただそうなら素直に「性能が20/22%向上」としても良い気もするのだが

    Photo03:ただそうなら素直に「性能が20/22%向上」としても良い気もするのだが

ちなみにこのCortex-X4とCortex-A720/A520はすべてArmv9.2-Aに準拠したプロセッサとなる。このため、Armv9.2-Aで定義された命令拡張、例えば「MTE(Memory Tagging Extension)」などが利用可能になる。

そしてこれらをつなぐInterconnectである「DSU-120」も大幅に性能が強化された(Photo04)。

  • Arm v9.2-A対応とは、MTEなどに代表されるセキュリティ拡張をサポートしたという意味と思われる

    Photo04:Arm v9.2-A対応とは、MTEなどに代表されるセキュリティ拡張をサポートしたという意味と思われる

具体的には最大14までCPUコアを接続可能であり、また最大32MB L3に対応。さらに効率向上とかBandwidth Partitioningなどの機能が追加されているとする。

次いでGPU IPであるが、今回発表された「Immortails-G720」は、前世代の「Immortails-G715」の改良版ではなく、新アーキテクチャに基づくものとなる(Photo05)。

  • 単に“Arm 5th Gen GPU Architecture”としたとのこと

    Photo05:「その新アーキテクチャのコード名は?」と確認したが、もうUtgard/Midgard/Bifrost/Valhallといった北欧神話から名前を引っ張ってくるのはやめて、単に“Arm 5th Gen GPU Architecture”としたとのこと

この新アーキテクチャ、Valhall世代との大きな違いとしてCPUとの協調動作が容易になった、という説明もあったが具体的な内容は不明である。あるいはDynamIQのACP(Accelerator Coherency Port)を利用できるようになっているのかもしれない。

この第5世代アーキテクチャのターゲットはこちら(Photo06)。

  • さらなる表現力の向上と消費電力削減の両立を目指した、とする

    Photo06:さらなる表現力の向上と消費電力削減の両立を目指した、とする

具体的にImmortalis-G720はImmortalis-G715と比較して15%の性能向上と40%の必要なメモリ帯域削減を実現、これによりメモリアクセスに伴う消費電力削減も同時に実現した格好だ。ちなみにエリアサイズは2%程度の増加に留まっているとする。

  • 5th Gen GPUのアーキテクチャ詳細は公開されていない

    Photo07:パフォーマンス向上は、アーキテクチャの変更によるものだろうが、まだ5th Gen GPUのアーキテクチャ詳細は公開されていない

これを両立出来たキーとなるのが「DVS(Deferred Vertex Shading)」で、要するにメモリアクセスを最後に持ってくる(処理を可能な限りShader内部のCacheで済ませて、最後の書き出しでDRAMにアクセスする格好)事で、必要とするメモリ帯域を37%減らした、とする。

  • DVSの効果はアプリケーションによって異なる

    Photo08:DVSの効果はアプリケーションによって異なり、Elven Ruinsで41%、Fortniteで26%、Antutu Terracottaで20%と結構バラつく。恐らく描画が緻密になるほど、効果は大きくなる

ちなみにImmortails-G720はRay TracingをサポートするフラグシップGPUだが、その下にハイエンド/メインストリーム向けのMali-G720およびMali-G620も同時にラインナップされるとする(Photo09)。

  • 恐らくMali-G720/G620も同じく5th Gen GPU Architectureベース

    Photo09:恐らくMali-G720/G620も同じく5th Gen GPU Architectureベースで、ただしRay Tracingの機能が無い物だろう。Mali-G720/G620の違いはシェーダの数と思われるが、この辺りの詳細はまだ不明

話をTCSに戻すと、Photo01でも判るようにTCS23を構成する周辺に関してはTCS22と変化が無い様に見える。ただ実際には、例えばCI-700はr2からr3になってアクセスのLatencyが25%削減されたとしており、細かな改良は色々あるものと思われる(Photo10)。

  • MMU-700もMTE対応とかが行われている気もするのだが

    Photo10:MMU-700もMTE対応とかが行われている気もするのだが

今回は基調講演前に行われた説明をベースにしているので、まだ色々不明な点は多い。こうした部分でさらに明確になった事があれば、後追いの形でレポートしたいと思う。