【MPF 2003 レポート】詳細が明らかになったEfficeon - 省電力面で本領を発揮

Photo01:発表を行う同社CTOのDavid Ditzel氏

Transmetaは、MicroProcessor Forum 2003(以下 MPF)にてEfficeon TM8000の発表を行った。日本でも発表があったので多少重複する部分もあるかと思うが(「Efficeon TM8000」が正式発表 - シャープ/富士通などから搭載機の予定も )、ここではMPFでの発表を中心にご紹介したい(Photo01)。

○Efficeonの構成

以前からTM8000の情報は小出しにされていたわけだが、今回はもっと細かな情報が出てきた。簡単にこれをまとめると
・256bitのVLIWで、最大8つの32bit命令を同時に実行できる。
・CMS(Code Morphing Software)が新しくなった。
・Pentium 4互換の命令セットを搭載し、MMX/SSEだけでなくSSE2もサポートする。
・AGPバスやDDR400メモリ、HyperTransport Linkをサポートする。
といったあたりになる(Photo02)。この結果、システム構成はPhoto03の様になる。

さて、TM5x00シリーズは省電力ではあったが、システム性能はあまり高いものではなかった。これに対し、Efficeonでは様々な性能向上のための仕組みが取り入れられている。旧来のCrusoeと比べて1クロックあたりの処理性能を倍増し(Photo04)、VLIW側の実行ユニットも充実させ(Photo05)、さらにCode Morphingについても4段階のレベルを設け、各々で最適化の度合いを変えるなどという工夫もなされている(Photo07~09)。

Photo02:主要な特徴。性能についてはまた後述する
Photo03:なんとなくAMDのAthlon 64にも似た構成。しいて言えばAGPコントローラを内蔵しているあたりが多少異なる
Photo04:TM5800との比較。IPC/動作周波数/消費電力の全ての面で改良があったと主張する
Photo05:Efficeonでは11個の実行エンジンがあり、各々が独自に実行される。Integer ALUとExecが分かれているとか、Aliasが別ユニットとして用意されているあたりに、命令の並列性を高めるために工夫した跡が見られる

Photo06:Code Morphingの1st Gear。一番性能は低いが、オーバーヘッドが掛からない処理。ISRなどレイテンシを重視されるところで利用されるのだろう
Photo07:2nd Gearでは、軽い最適化が行われると同時に、処理ステップのフロー情報が付け加えられる。1st Gearで一度処理したコードは、以後は2nd Gearで処理される
Photo08:3rd Gearは2nd Gearの最適化レベルを進めたもの。メモリのリオーダリングや、コードの最適化、クリティカルパスの調整などが含まれる
Photo09:フル最適化の4th Gear。最速ではあるが、最適化のためのオーバーヘッドも一番大きい

実行ユニット側はというと、アウトオブオーダ発行の搭載やループ除去/命令融合などかなりの最適化技法を凝らしているが(Photo10)、その割に整数演算はたった6段のパイプラインでしかないといった、なかなか他に類のない構造である(Photo11)。

Photo10:処理ユニット自体はIn-Orderであるが、CMSの側でOut of Orderの発行を掛けるという、いわばソフトウェアによるOut of Orderがサポートされる。ループ除去とか条件分岐除去などの最適化も行われている
Photo11:整数演算は6段、浮動小数点演算でも8段しかない、非常に短いパイプライン。冷静に考えると、この短いステージで1.3GHzが達成できるわけだから、昨年のSamsungのHallaにも匹敵する偉業...なわけだが、じつはこのパイプラインにはDecodeが入ってないので、普通に考えれば7段か8段のパイプラインという計算になる。とは言え効率が高い事に変わりはないが

これを支えるため、キャッシュ構造も強化された。データL1キャッシュこそ従来のTM5800と同じ64KBだが、命令L1キャッシュとL2キャッシュはそれぞれ倍の128KB/1MBとされている。また、メモリキュー周りも大幅に強化された(Photo12)。面白いのは命令キャッシュがそのまま実行パイプラインにつながっているのではなく、一旦フロントエンドを介していることだろう(Photo13)。

ちなみにダイサイズは130nmプロセスで119平方mm、90nmプロセスで68平方mmとされている(Photo14)。130nmは従来同様TSMCでの製造となるが、90nmについては富士通セミコンダクタでの製造となる(Photo15)。

Photo12:Undo/Commitのためだけに64のレジスタが用意され、このうち48がShadowになっているあたりが特徴的。ところでこのShadowの反映をどこでやるのか、がパイプラインに記述されていないあたりがちょっと謎で、このあたりは後でレポートしたい
Photo13:命令フェッチがパイプラインから分離されている関係で、ちょっと複雑な構造をとっているキャッシュ管理
Photo14:フロアプラン。119平方mmはかなり大きく感じるが、その大半は1MBのL2キャッシュやNorthBridge機能(AGPコントローラ、メモリコントローラ、HyperTrasnport)で占められており、純粋なCPUコアの面積は50平方mm前後でしかない
Photo15:製品ラインナップとロードマップ。Generation-3についてはまだ詳細が未定ということで、細かい話が公開されていない

ところで今回サウスブリッジとの接続はHyperTransportになっている。今のところHyperTransportで接続できるサウスブリッジは
・NVIDIA nForce3シリーズ
・ULi M1563/1563M
・AMD AMD-8111
の3種類があるわけだが、メインとなるのはNVIDIAかULiのどちらかとなるだろう。特にNVIDIAは、既存のnForce3 Go150と全く同じ機能と性能を持ちながら、パッケージサイズを小型化したnForce3 Go120を発表しており、これを使うことでパッケージの実装面積を大幅に節約できる、としている(Photo16)。ちなみにEfficeon自体も、プロセスや速度、L2キャッシュサイズなどの違いでいくつかの製品ラインナップを持つことになっている(Photo17)。詳細な価格は今回明らかにされなかったが、大まかに言えばEfficeonの製品価格は100ドル前後(それも70~80ドル前後がメインとなるかもしれない)との話だった(Photo18)。

Photo16:VAIO-U101の様な製品はあるとはいえ、CPU+チップセットのフットプリントがかなり大きいのはPentium Mのディスアドバンテージの1つであることは良く知られている。NVIDIAのnForce3 Go 120は、このためにわざわざ小さいパッケージを用意しており、結果としてフットプリントは4分の1となる。とはいえ、ここにはグラフィックの分が入ってないので、855GM/GMEと比べると1/3程度になると思う
Photo17:130nmと90nmの各々で、スタンダード/ローコスト/スモールサイズの3つのパッケージが用意されるため、合計6製品ということになる
Photo18:Efficeonは100$に近いところにしたいとしているが、130nmのスタンダード品は$60~$70あたりに収まることになるようだ。スモールパッケージは$100を超えるあたりで、ローコスト版は逆に$50のあたりになるだろう。本音から言えばTrasmetaはもう少しASPを引き上げたいのだろうが、まず其の前に採用事例を増やすのが先、というあたりだろうか?

○Efficeonの性能

さて性能はどうか、についてもいくつかの数字も示された。例えばセキュリティ関連の処理でよく利用されるSHA-1/RSA/AESの各処理を行った場合、同一クロックだとEfficeonはPentium 4やPentium Mと比べて高い処理性能を示しており(Photo19)、また同一のTDP(例えば7W)で比較した場合、Pentium Mは900MHz動作に限られるが、Efficeonは1100MHz動作が可能であり(Photo20)、この「TDP7Wという枠で処理をさせた場合、EfficeonとPentium Mの処理性能の差は更に広がる」としている(Photo21)。同様に浮動小数点演算の性能も「同一TDPの枠なら」はるかに上回るとしているが(Photo22)、これはちょっと強引な気もしなくはない。同様に様々なアプリケーションの結果がPhoto23にまとめられているが、Pentium Mよりも性能面で圧倒的に有利という訳ではないといえる。

Photo19:単純に1GHz動作をさせると、(処理によって得手不得手はあるものの)Efficeonは割と良い性能を示すことがわかる。少なくとも整数演算のIPCはPentium 4を超え、Pentium M並かそれ以上、ということになる
Photo20:Baniasの場合、7WのTDPで収まるのはULV Pentium M 900MHz/1GHzの2製品のみで、通常のPentium MはもっとTDPが高い。そう考えると、まぁ優秀であるとは言える
Photo21:同じTDPならもっと性能差が広がるという主張だが、せめてPentium Mは1GHz品を使うではないか、とは思う。もっとも1GHz品を使ったところで、さして結果に違いはないとも思うが
Photo22:この結果自体は嘘を言っていないのかもしれないが、Pentium MもEfficeonも1GHz動作に正規化した場合、Efficeonは1736に、Pentium Mは1724になるわけで、つまり浮動小数点に関しての(動作周波数あたりの)効率はどちらも殆ど変わらない事を示していると判断すべきだろう
Photo23:この結果も、Pentium M/1GHzを持ってくると、もっと微妙なものになったと思われる。まぁ、いい勝負であることは間違いないと思うが
Photo24:消費電力ではPentium Mを圧倒している結果が示されている。内訳がなかなか興味深い

むしろEfficeonの本領は消費電力の面で発揮される。Photo23までで示したTDP 7Wは動作時の最大熱設計電力な訳だが、フル稼働していない状態、例えばWindows XPでアイドル状態の消費電力を比べると、システム全体で1/8以下になる(Photo24)といったあたりが、Efficeonの大きなメリットと言える。CPU+Northbridgeでの比較では、その差は10倍にも及ぶ事が、プレゼンテーションだけではなく動作デモでも示されるなど、これが大きなウリである事は明確だった(Photo25~27)ちなみに、「現実的な構成を考えると、3D性能も大きく上回る」(Photo28)との主張があったが、さすがにこれはちょっと大げさな気がする。

Photo25:赤外線温度計を使ってのコア周辺の温度比較。Pentium Mの方はヒートシンクをはずされている事もあってか、かなり高温になっている
Photo26:電力計を使っての消費電力比較
Photo27:展示会場での実際の温度デモ。周囲温度が高かったせいか、ちょっと温度は高め。ちなみにIdle状態のコアを指で触ってみたら、ちょっとひんやり感じた
Photo28:855GMの内蔵グラフィックがGeForce 420 Goに勝てる訳がないのであって、別にEfficeonだからという訳ではないと思う

ちなみにMPFと同じFairmont Hotel内で行われた展示会ではシャープ/富士通が開発中のマシンが展示されたほか、様々なサンプルが示されていた。

Photo29:シャープのデモ機。これは既存のTM5800搭載 MURAMASAの内部をTM8000に置き換えたもので、今すぐこれを製品として出すとかそういうものではないそうだ
Photo30:こちらは富士通のサンプル機。液晶は大きめだが、これもとりあえず液晶を付けてみたというレベルで、実際の製品仕様にあわせたものではないそうだ
Photo31:MicroATXサイズのEfficeonボード。これはあくまで開発用のサンプルということらしい。サウスブリッジがGeForce3 Pro 250な事に注意
Photo32:直接の展示はなかったのだが、Photo27の展示に使っていたマザーボードはULiのM1563Mを搭載していた。ULiの関係者によれば、(GeForce3 Go 120の様な)シュリンクパッケージは今のところ考えていないとの事

○ということで

いろいろこぼれ話やらLongRun2の話がまだまるっきり残っているわけだが、実はこの原稿を書いている翌日にTransmetaとのMeetingを控えているので、こうした話はMeeting後のPart2でお伝えすることにしたい。いろいろと興味深い話があるので、ご期待いただきたい。

Photo33:謎のブレードサーバー。何でも3Dレンダリングのために使うそうで、実際のレンダリング作業はGeForce Go 420が行うとか。Efficeonはコントロールのためだけに利用しているそうだ。「ならEfficeonでなくても」という話はありそうだが、ちゃんとEfficeonでなければいけない理由があった。このあたりはPart2で触れたい

(大原雄介)

「Efficeon TM8000」が正式発表 - シャープ/富士通などから搭載機の予定も
http://pcweb.mycom.co.jp/news/2003/10/15/07.html

Transmeta、90nm Efficeonのファウンダリパートナーに富士通を選択
http://pcweb.mycom.co.jp/news/2003/10/08/25.html

TransmetaがNVIDIAと戦略提携 - Efficeon用に統合チップセットを開発
http://pcweb.mycom.co.jp/news/2003/09/17/30.html

Transmeta、新プロセッサ名称を「Efficeon」と発表 - Q4には搭載製品登場
http://pcweb.mycom.co.jp/news/2003/08/12/15.html

Transmeta、新プロセッサ「Astro」の情報を一部公開 - Q3には量産
http://pcweb.mycom.co.jp/news/2003/03/10/06.html

Transmeta
http://www.transmeta.com/

MicroProcessor Forum
http://www.mdronline.com/mpf/



人気記事

一覧

イチオシ記事

新着記事