次世代スマートフォンが要求する性能に対応するハイエンドCPUコア「Cortex-A72」

英ARMは2月4日、ARM v8-Aに基づく64bitアプリケーションプロセッサのハイエンド製品として「Cortex-A72」を発表したと同時に、これに合わせる形でGPUコアの「Mali-T880」なども発表した。この新製品発表会は英国・アメリカと北京で行われており、この北京での発表会の模様をお届けしたいと思う(Photo01)。

Photo01:まず説明に立ったPete Hutton氏(Exective Vice President and President, Product Groups, ARM)

説明会では、スマートフォンの性能に対する要求が相変わらず高いままであることに触れた上で(Photo02)、ここに向けてCortex-A72とMali-T880、およびCCI-500とTSMCの16nm FinFET+対応POP IPが提供されることが明らかにされた(Photo03)。

Photo02:加えて言えばメモリの搭載量も年々増えつつあるが、これは直接SoCには関係ない(メモリチップ側の記憶密度の問題)ためか省かれている

Photo03:各々の詳細は後述

さてこの製品は現状ではハイエンド向けという形になるが、ではハイエンド向け製品にはどのようなニーズが求められているのかというARMなりの回答がこちら(Photo04~09)。

Photo04:各々の要素そのものは、すでにある程度実現されているものであり、これを今後どう質を高めてゆくかという話でもある

Photo05:TVなどに先駆けて、むしろMobileの方が先に4Kを実現しかねない勢いであるのはご存知の通り。とりあえず4Kを普通に扱えるようになることは間違いなく求められている

Photo06:さすがにスマートフォンでこれはあまりニーズが無いとは思うが、タブレットではすでにこうしたニーズがエンタープライズ向けに利用され始めている

Photo07:自然言語認識は、どこまでサーバ側に処理を持ち込むかという話ではあるが、ここでキーになるのは左上の"No Servive"。つまりサーバに繋がっていない時でも、自然言語認識ができるようになってほしいというニーズはあるという話で、そのためには処理性能が必要となる

Photo08:2D写真から3Dデータを生成して3Dプリンタに、という流れ。これも処理性能が必要になる

Photo09:Super Slowmotion撮影して、そこからフォームを分析するというデモ。とにかくデータ量が多くなる作業を如何にMobile Deviceで行うかという話

もちろんマジョリティである大多数のユーザーにとっては、現状ではまだこんなニーズは無いだろうし、そうした性能を求められてはいない。ただ、昔は電話だけできればよかったものが、今はSNSでAll-time connectedが当たり前になっている訳で、マジョリティのニーズも次第にリッチになってきている。そのため、マーケットの裾野を広げるためには、トップエンドの製品の性能はより高くしておく必要があり、そこに向けて既存のCortex-A57に替えてCortex-A72とMali-T880を投入することで、最終的にはボリュームゾーンであるマジョリティ向けのローエンド製品の性能底上げも果たそう、というのが同社の長期的な戦略と見てよいだろう。

さて、ここからはNoel Hurley氏が説明に立ち、もう少しIPの詳細について説明が行われた(Photo11、12)。

Photo10:コアの詳細の説明を行ったNoel Hurley氏(General Manager of CPU Group)

Photo11:今回の新製品はそんなわけでCPUとGPU、インターコネクトとこれに対応したPOP IPである

Photo12:Photo11が各々の要求で、それに対するARMの回答のサマライズがこちら。まぁ、これはちょっと単純化しすぎの嫌いはあるが…

まずプロセッサコアであるが、Cortex-A72はARM v8-Aをサポートしたハイエンド製品である(Photo13)。Cortex-A15と比較して3.5倍、Cortex-A57と比較しても1.8倍という性能が示されている(Photo14)ほか、エネルギー効率もCortex-A15と比較して4倍近く向上する(Photo15)という数字が示されている。すでにこのCortex-A72は10以上の顧客にライセンスされているということであるが、今回プレスリリースではHiSilicon、MediaTek、Qualcomm、Rockchipの4社がライセンスを受けていることを強調している。

Photo13:ARM v8-Aそのものを何かEnhanceした訳ではなく、命令セットそのものは変更がないとの事だった。ちなみにCortex-A15と比較する場合、性能の改善は「命令セットそのものの違い(32bit命令より64bit命令の方が効率的)」、「プロセスの違い(TSMCの28nm HPMあたりと比較すると、16nm FinFET+はだいぶ性能そのものが改善されている」、「マイクロアーキテクチャの違い」の3つの要素が関係してきており、トータルでの性能比が3.5倍ということになる

Photo14:Cortex-A57の数字に、TSMCの20nmプロセスのものを使っているのがトリックの肝である

Photo15:big.LITTLEを使うとさらに40~60%の性能改善が可能、としている。もっともこれを比較するのならCortex-A15あるいはCortex-A57でもbig.LITTLEの場合の数字を持ってこないと公平ではない気が…

Photo16:今回北京で発表会を開催した最大の理由は、HiSilicon/Mediatek/Rockchipといった中国系ベンダーが含まれている事であろうと思われる

これを支えるのがCCI-500(Photo17)であるが、これについてはもう少し後で改めて説明したい。とりあえずスペックで言えば、これまで広く使われていたCCI-400から大幅に性能を改善している。

Photo17:CCI-400とCCI-500の違いはいくつかあるが、純粋な転送速度とか接続できるデバイス/ノードの数の違い以外に、CCI-500ではSnoop Filterが搭載されている点が挙げられる。これは特にキャッシュコヒーレンシをとる場合に効果的に働くと思われる

次がMali-T880で、これは同社のT800シリーズのハイエンドに属する(Photo18)。ARMは昨年10月にMali-T820/830/860を発表しているが、このシリーズのハイエンドに相当する。ちなみにShader CoreそのものはMali-T860と同じ16個だが、各々のShader Core内部のALUが強化されている。これも後ほどもう少し詳細を説明したい。これにより、例えばMali-T760と比較して1.8倍の性能を持ち、かつエネルギー効率を40%改善したとしている(Photo18)。

Photo18:絶対性能はSCとALUの数、それと動作周波数で決まるが、エネルギー効率についてはマイクロアーキテクチャ上の改善があったとの事。これも後述

これを支えるというか、インプリメントを容易にするのがPOP IPである。ARMは今回TSMC 16nm FinFET+に対応したPOP IPを提供することを発表しており、これによりインプリメントが容易になると説明している。

Photo19:ちなみにPOP IPが提供されるのはCortex-A72とCortex-A53、それとMali-T880のみである。これも後述