7月25日、英ARMの日本法人アームは都内で記者説明会を開催、ARMでGPU部門を統括するLance Howarth氏が来日し、同社のMali GPUに関するロードマップを説明した(Photo01)。

Photo01:Lance Howarth氏(Executive Vice President and General Manager, Media Processing Division)

まず氏は現行製品としては最高速である「Mali-400MP」を搭載したGalaxy S2が主要なベンチマークで「現行商品としては最高速」のGPU性能を紹介(Photo02,03)したうえで、今後はより高い性能が必要になると紹介(Photo04)し、またMobileのClientベースでもGPGPUのUsageが今後登場してくるという話を説明した(Photo05)。

Photo02:氏によれば、Engadgetのコメントがとてもお気に入りらしい。主要な最新製品のベンチマークスコアの一覧である

Photo03:こちらはGLBenchmark 2.0のスコアをもう少し詳細に紹介。ちなみに消費電力の観点から、Galaxy S2に内蔵されるMali 400は定格の60%の動作周波数に落として動作しており、必要なら更に性能を上げられると説明した

Photo04:この図は昨年も公開されたもの。実は会場で「4K2KをMobileで持ち運んだりしないでしょ?」と突っ込みを入れようかと思ったのだが、最近のスマートフォン向け液晶は既に300dpiとか400dpiを可能にしており、たとえば400dpiだと4K2Kはたかだか10inch×5inch(25.4cm×12.7cm)だから、ちょっと大きめのTabletならこの範疇に入る計算になる。これはこれで恐ろしい話である

Photo05:多少なりとも具体的な例は昨年紹介している事もあってか、具体的な話はここではなし

さて、このあたりまでの話は2010年のARM Forum 2010におけるMali T604の発表内容と大差ない(Mali 400の実績が加味された程度)だが、この後のロードマップはちょっと目新しいものだった。もともと昨年のARM Forum 2010の話は「2014年には200億個以上のARMコアを出荷する」というテーマに沿ったもので、ロードマップもこのため2014年までをカバーしたものだったが、GPUに関してはMali T604の発表直後とあって、あまりロードマップらしいものは明らかにされなかった。今回はこれが2013年あたりまで発表されたのが大きな特徴である(Photo06)。このPhoto06中に緑で示されるMidgard Architectureの第1世代製品がMali-T600シリーズということになるが、2012年に予定されるNext GPU、および2013年に予定されるFuture GPUはいずれもT600のアーキテクチャの延長にあると説明された。

Photo06:ちなみに縦軸は、相対性能を指数表示したもの、だそうである。とはいえ、軸が明確になってないあたりは、あくまでコンセプトと考えるべきなのだろうが

そのT600であるが、2010年はアーキテクチャはともかく性能に関する具体的な数字が無かったが、今回は多少なりとも具体的な数字がでてくる事になった(Photo07)。

Photo07:この数字だけ見ても判断がしにくいので一例を挙げると、Mali-400MPの場合は65nm LPで240MHz、65nm GPで395MHzという数字があり、275MHzの場合に最大1.1Gpix/sとされる。395MHzだと理論上1.58Gpix/sという計算になる

また開発環境周りでは、ARM DS-5 StreamlineでCPUとGPUのオフローディングのパフォーマンス分析を可能にする、という話が出てきたのもちょっと興味深い(Photo08)。

Photo08:GPGPU的に利用できるのはMali-T600シリーズからになるので、これはT600で初めて利用できる機能。ただこれはあくまでもパフォーマンス分析が出来ますというレベルの話である

ざっくり内容を説明し終わったところで、もう少し解説を。まず2012年のNext GPUや2013年のFuture GPUに関しては、基本的には同じ構造であるが、より多くのコア(T604は最大4コア)や高い動作周波数、それとコアそのものの改良も行われることで、トータルとして性能を引き上げてゆくという話であった。

ただしソフトウェアから見ればこの3世代に関しては完全に同一のものとして扱える、と氏は説明した。こうした話は当然前提となるプロセスがどうなるのか?という話と関係するが、氏によればMali-T604は28nmプロセスがターゲットであり、したがってNext GPUは20nmとかになるだろうという話であった。話がややこしいのは、ARMが提供するのはあくまでもIPであり、最終的な構成はあくまでクライアントが決めることになる。なので(最終製品を提供するメーカーと異なり)なかなか性能などを推定しにくいところがあるが、氏によれば(Cortex-AシリーズやMali GPUなどを搭載する)SoCの場合、価格的なポイントからダイサイズのスイートスポットは概ね10平方mm程度になり、昨今のトレンドはCPUとGPUのダイサイズの比が1:1に近づいているとしている。

また消費電力としては、SmartPhoneの場合は大体800mW~最大1W、Tabletの場合はもう少し許容されるが、それでも最大2W程度が(バッテリー寿命から換算して)許容されるGPUの消費電力であり、この枠に収めないといけないという見通しだった。大体このあたりの制約条件があることで、性能の大枠が定められるというのが氏の説明である。

また2011年10月にSanta Claraで開催されるARM Techcon 2011では、T604の姉妹製品が発表されるという話であったが、これがT604の上位モデルなのか、あるいは下位モデルなのかは現時点では不明である。T604自身は、ARM自身のEngineering Sampleは今年中にリリースされる予定で、これを搭載したクライアントのSoCを搭載した製品が市場投入されるのは、2012年後半になるだろうという見通しが明らかにされている。

ところでGPGPUの用途は?という話である。説明会では「モバイルコンシューマ向けのGPGPU的な用途を考えている」という話であったが、説明会の後で「ところでCortex-A15は単にコンシューマだけではなくサーバマーケットも狙うという話をしている。ということはGPU側もこうしたHPCマーケット向けの可能性はあるのではないか?」と水を向けたところ、確かにそうした部分を考えているという話が出てきた。

また、「今はCoreLink経由でCPUとGPUのキャッシュ/メモリコヒーレンシを取っているが、それでもまだCPUとGPU間のアクセスのレイテンシの大きさが問題では?」とさらに水を向けたところ、将来世代(おそらくNext GPUのレベルではなく、2013年のFuture GPUやさらにその先だろう)では、CPUとGPUを交互に複数個並べ、間をRing Busで繋ぐことでレイテンシの削減とスケーラビリティの確保を行うようなアイディアがあることを明らかにした。

実のところ、何で今回唐突にGPUの記者発表会を行ったかといえば、先週7月22日にNVIDIAが開催したNVIDIA GTC Workshop Japan 2011を強く意識したものだったと考えられる。こちらのイベントはNVIDIAのGPGPU的な取り組みを主に説明したものであるが、ARMはTegraファミリにARM11あるいはCortex-AシリーズのCPUライセンスをしており、またProject Denver向けにARM V7のアーキテクチャライセンスを供与しているものの、GPUに関しては完全な競合関係にあるといって良い。

実のところGPGPUに関しても、今はNVIDIAのみがこの方面に強くフォーカスするメッセージを発しているが、ARMの顧客である多くのファブレス半導体ベンダにとってもこのマーケットは無視できない部分であり、そうしたファブレスベンダの多くがARMのMaliを採用するケースが事実多い(すでにMaliは40社以上の企業にライセンス供与されている)事を踏まえると、今後GPGPUマーケットにMaliベースのGPUで参入を考えるベンダはすでに居ると考えるべきで、そこに対してMaliのGPUが有力であることをある程度アピールする必要がある。とはいえ、NVIDIAと違ってGPGPU的に利用できる製品はまだシリコンとして存在していないから、とりあえずは将来ロードマップなどを紹介する程度にとどめておいた、というあたりではないかと思う。