英ARMは3月21日に北京市内のホテルで、次世代Cortex-Aに採用するマルチコアアーキテクチャとなる「DynamIQ」を発表した。同社が「マルチコアの再定義」と表現する「DynamIQ」について、ここでは発表会の取材を基に解説を行う。

ARMは、マルチコアの構成方法を大きくかえる。現在のマルチコアは、4コアを最大とするクラスタを作り、クラスタでL2を共有、電力管理をクラスタ内で行っている。クラスタと内部バスの接続にACE(AXI Coherency Extensions)を使う。

これは、キャッシュコヒーレンシー機能に対応したAXI(Advanced eXtensible Interface)で、これらの接続は、AMBA(Advanced Microcontroller Bus Architecture)と呼ばれる技術の一部だ。ARMは、Cortex-Aプロセッサコアの設計だけでなく、AMBA技術も半導体メーカーにライセンスしている。

DynamIQでは、1クラスターを最大8コアとして、クラスター内でのbig.LITTLEプロセッシングなどに対応する。また、クラスター内の接続や電力管理を強化し、メモリコントローラーも改良する。

発表会に登壇したのは、ARM副社長で、コンピュート製品事業部部長のNandan Nayampally(ナンダン・ナヤンパリー)氏。同氏は、過去からのARMの成長を振り返る。1991年に登場したARMプロセッサは、22年かけて2013年までに500億個のチップを出荷したが、2017年中には、さらに500億個のチップの出荷が見込まれる。そして2021年までには、さらに1,000億個のチップが出荷されることになるだろうとした。

北京での発表会には、Nandan Nayampally(ナンダン・ナヤンパリー)氏が登壇した

2013年から2017の4年間で500億個のチップが出荷され、その後の5年間では、さらに1000億個のチップが出荷されると推測されるという

Nayampally氏は「ARMのプロセッサが"コンピュートの地平"を変革した」という。いまや35億の人々がARMベースのプロセッサを「最初のコンピューティングデバイス」として利用している。さらにCPUの性能は、2009年と比較して100倍に達し、サーバー用プロセッサが登場するなど、Cortex-Aシリーズは、チップからクラウドまでをカバーしつつある。

35億人がARMプロセッサを搭載したデバイスを使っているという

そして現在、新しい利用領域が広がりつつある。AIや自動運転、Mixed Reality、そして超高効率のプロセッサなどだ。それらはこれまでよりも高いセキュリティが必要となる。このため、CPUデザインには、新しいアプローチが必要になるという。それが「ARM DynamIQ」だとした。

AIや自動運転、MRなどを高いセキュリティで実現できるCPUデザインが必要になるという

DynamIQとは「マルチコアの再定義」だとナヤンパリー氏はいう。クラスタを変更し、big.LITTLEの有無を選べるなど高い柔軟性を持たせた。メモリサブシステムは再設計され、計算機能も強化されるという。

DynamIQは、最大8つの異なるCortex-Aプロセッサのマルチコアを1クラスタとして構成できるようになる

特にAIに関しては、AI専用の新規命令により、高速化が行われる。DynamIQに対応した今後3~5年以内に登場するプロセッサでは、現在の50倍の性能をAI処理について出せるようになる予定だという。またDynamIQ対応のプロセッサシステムは、自動運転でASIL Dクラスをサポートする予定だ。ただし、これらは、DynamIQを採用する新世代のCortex-Aプロセッサが達成することであり、DynamIQ自体は、AIにも自動運転にも直接関係していない。

DynamIQには、AI用の専用命令が追加され、5年以内にAI処理性能が50倍となり、さらにコア間接続などが高速化されアクセラレーターにも10倍の速度で応答できるようになるという

また、DynamIQ対応プロセッサは、自動車用安全規格の安全性要求レベルD(ASIL D)に対応する予定だという

ARMのマルチコアは、最大4コアのクラスターから始まり、big.LITTLE世代では2クラスタを組みあわせることができるようになった。さらにDynamIQでは、より柔軟なコア構成が可能になり、従来よりも応用範囲が広くなった。

DynamIQでは、現在の2クラスターで最大8個という応用だけでなく、それ以上の範囲もカバーできるように、クラスター設計を変更し、柔軟性を上げた

DynamIQは、ARMのマルチコアアーキテクチャ、つまり、プロセッサークラスタを新規に作り直した。1クラスターには、最大8つの異なる種類のCortex-Aシリーズコアを入れることが可能になる。8コア以上は、クラスターを相互接続することになる。

また、DynamIQでは、クラスタ内でbig.LITTLEプロセッシングに対応する。big.LITTLEプロセッシングは、OSのタスクスケジューラーのレベルで行われる、負荷に応じたプロセッサ間のタスクマイグレーションの仕組みだ。処理負荷が高いタスクは高性能なコアで、低いものは、電力効率の高いコアにタスクを割り当てなおす。ただし、これはOSのタスクスケジューラーのレベルで行われるので、ミリセカンド単位での切り替え動作となる。

DynamIQては、クラスター内でbig.LITTLEプロセッシングが可能で、タスク切り替えが高速化し、メモリ共有の効率があがるという

これを1つのクラスタ内で行うことで、big.LITTLEプロセッシングする場合のコアの組み合せにも柔軟性が高くなり、また、bigとLITTLEの2極だけでなく、中間の段階も持つことができるという。

このほか、クラスタ内ではハードウェアによる自動的な電力、パフォーマンス管理も行われる。同様のものは現在のCortex-Aシリーズにもあるが、DynamIQ世代では、クロック・電源電圧の変更がより細かくなり、電源オフ/スリープ/オンの電力状態もより高速に遷移可能になる。

DynamIQでは、組み込みのハードウェアにより、CPUの速度制御(クロック周波数と電源電圧の切り替え)が現在よりも細かく行えるようになる。電源状態の切り替えも高速化する

最後にナヤンパリー氏は、ARM DynamIQは、将来のコンピューティングを再定義し、デバイス操作を変更、セキュリティを守る「トータルコンピューティング」のアーキテクチャであり、次の1,000億個のチップの力添えになるとして講演をしめくくった。

ナヤンパリー氏は、DynamIQは、次の1000億個のチップのための技術であるとして講演を締めくくった

今回の発表の本質は、新しいマルチコアアーキテクチャだ。ただし、このマルチコアアーキテクチャであるDynamIQには、新しいCortex-Aプロセッサから対応が行われる。つまり、今後登場するであろう次世代プロセッサからDynamIQが採用される。