【MPF 2002 レポート】次期Mac用プロセッサ?の64bit PowerPC

 
Photo01:説明を行ったSeniar PowerPC Processor Architect, IBM MicroelectronicsのPeter Sandon氏

Windowsの世界では関係ないことではあるが、常々話題になっていたことにAppleの次のプロセッサがどうなるか、という話がある。PowerPCは最終的に1GHzの壁を越えたものの、そこで打ち止めの感が強く、Appleは遂にデュアルプロセッサ構成をデスクトップ製品に投入することになった。単体の性能が上がらなければ、数を増やして性能を確保しようという発想だが、そうはいってもプロセッサの性能自体が上がらなければ、やはり将来の見通しは明るくない。

そういったバックグラウンドがあるため、IBMが発表した新しいPowerPCチップは、(IBMは一切その点について触れなかったが)将来のAppleの製品向けプロセッサとして会場では受け止められた。ではその新しいPowerPCについて説明したい(Photo01)。

○過去のPowerPCとは別の系統になった製品

まず講演の内容に入る前に、既存の製品の流れをおさらいしておこう。PowerPCの系列を簡単にまとまたのがPhoto02だ。要するに既存のPowerPCの製品系列は、基本的には初代のPowerPC 601のアーキテクチャを次第に発展させてきたものである。ただしここでちょっと断っておくと、このプロセッサはIBMとMotorolaの両社が製造しており、このふたつは完全に同じものではない。例えばPowerPC G3はIBMの製品だが、PowerPC G4はMotorolaの製品となっている。したがって、G3をそのまま発展させたのがG4になるわけではない。あくまでも製品の特徴は継承しているが、内部構造はかなり異なっている。

Photo02:前日に行われたセミナーのプレゼンテーションから。製品の流れが実にわかりやすいというか、なんと言うか...ちなみに初めのPowerPC601は、IBMのPowerアーキテクチャのサブセットと考えれば良い。
Photo03:PPC970は既存のPPC750系列の延長の製品ではない。

今回発表されたPowerPC 970(PPC970)は、こうした32bitプロセッサコアとは別の製品系列になる(Photo03)。一言で言えば、IBMのPower4という64bitプロセッサのサブセットとなるのがPPC970ということになる。具体的に言えば、IBMのPower4というCMP(Chip Multi Processor)コアをベースに、SIMD演算ユニット(AltiVec)を追加し、全体のサイズを小さくしたのがPPC970という位置付けになる(Photo04)。この結果、コアおよびパッケージのサイズはPower4より随分小型化された(Photo05、Photo06)。内部構成は64bitになったが、勿論32bitとの互換モードもちゃんと持っている。考え方としては、IntelのItanium(64bitコアと32bitコアが別に用意される)というよりもAMDのHammer(64bitと32bitが同じコアで実現されている)に近いものだ。

Photo04:Power4は2つのプロセッサコアと巨大なL2キャッシュ、バスインターフェースをワンチップ化した製品である。これのサブセットがPPC970という訳だ。
Photo05:ダイサイズは発表されていないが、パッケージは25mm角の576pin CBGAと発表されている。

Photo06:ダイ内部。下のほうにL2キャッシュが、その上にはL1キャッシュがそれぞれ見える。
Photo07:昨年開催されたMPF 2001におけるIBM Microelectronicsの講演から。

内部構成はというと、これまでとはまったく異なるものになった。Photo07に既存のPowerPC 750の内部構成を示すが、これは比較的わかりやすいものだ。2つの実行ユニットと1つのロードストアユニット、FPUなどが用意され、おのおのがスーパースケーラで実行されるものだが、実行ユニット自体は整数演算で7段、ロード/ストアでも9段程度と(今となっては)浅い。これに対しPPC970は、1クロックあたり最大8命令のフェッチユニットや、毎クロックあたり1グループ(4命令+分岐)の処理が可能なディスパッチ/発行ユニット、最大25段にもおよぶパイプラインなど、まったく内部の構造は入れ替わっている(Photo08)。内部アドレスは42bit構成となっており、実行ユニットは合計12も装備されている。ただし、その中身はというと

・ロードストア×2
・ALU×2
・浮動小数点×2
・SIMD演算ユニット(AltiVec)×4
・分岐処理ユニット
・条件処理ユニット

という形になっており、整数演算よりもむしろ浮動小数点に重点をおいた構成になっていることが見て取れる(Photo09)。

Photo08:ちょっと判りにくいが、Power4では複数の命令をGroupという形でまとめて処理する。したがって、毎クロックあたり4命令+分岐命令のディスパッチが可能であり、発行は最大8命令/クロック可能。最大200命令を発行済にしておくことができる。L1データキャッシュは32KBとそれほど多くないが、512KBのL2キャッシュや、8本のデータプリフェッチストリームを保持できるため、それほどデメリットとはならない。
Photo09:"Execution"の説明と数が合わないが、"2 SIMD sub-unit"の片方が内部では更に3つのsub-unitに分かれるため、合計で12という計算になる。

ちなみにパイプラインはというとPhoto10の様な具合だ。非常に強力なフェッチ/デコード/ディスパッチユニットを持つ関係で、フェッチ/デコード段が9段、ディスパッチは1~2段を必要とするが、実行自体は整数演算系で5段、浮動小数点でも10段とそれほど多くない。極端なのはSIMD演算で、簡単なもので7段、一番複雑な浮動小数点では15段にも達している。もっとも、これはAltiVecが現在存在するPC向けのSIMD演算ユニットとしては例を見ないほど複雑かつ多機能な事に起因する。Photo10はそのSIMD演算ユニットの詳細だが、162の命令のほぼ全てを1スループットで実行するためには、こうした複雑な構造が必要だったようだ(Photo11)。

Photo10:それぞれ
L1/L2:ロードストア
X1/X2:ALU
BR:分岐処理
CR:条件処理
F1/F2:浮動小数点ユニット
VX:SIMD演算ユニット(Simple fixed)
VC:SIMD演算ユニット
(Complex fixed)
VF:SIMD演算ユニット(Float)
VP:SIMD演算ユニット(Permute)
となっている。
Photo11:AltiVecの特徴の1つは強力なデータの並べ替えだが、このためPermuteユニットが分離されているのがちょっと面白い。もっともこの部分に関しては、MotorolaのPowerPC G4に良く似ている。

ちなみにバスインタフェースは、Point-to-Pointの32bit幅のシングルディレクションのリンクを2組用意し、最大900MHzものスピードで接続している。ちなみに事前の報道では今回のPPC970がメモリインターフェースを内蔵するという話があったが、今回の発表を見る限りそういった話はなく、外部にノースブリッジに相当するコンパニオンチップが必要なようだ(Photo12)。

○非常に高い性能を相変わらず確保。問題は……

では気になるパフォーマンスはどうか? Photo13に示す通り、非常に高速である。PPC705FXと直接比較することができない(PPC705FXのSPECint95/SPECfp95の値は公開されているが、SPECint2000/SPECfp2000の値は公表されていないため)が、2GHzのOpteronプロセッサの値がそれぞれ1202/1170だったことを考えると、1.8GHzのプロセッサで937/1051というのはかなり良い成績と言える。

Photo12:トポロジーを見る限り、このバスの構造は極めてHyperTransportに類似している。最大900MHz、32bit幅のBi-Directionだから計算上はピークで7.2GB/secになる筈だが、6.4GB/secに抑えられているのは、アドレス・データ・コントロールを混在させているためにオーバーヘッドがあるためだろう。
Photo13:Opteronの数字を考える場合、OpteronはPC2700(2ch)で5.4GB/secの帯域を持ち、しかもかなりL2キャッシュが大きいだろう事を考慮する必要がある。デスクトップ向けのSledgeHammmerではもう少し数字が下がるはずで、しかもPPC970は1.8GHzだから、同一クロックなら更に差は縮まる筈だ。

ちなみにこれは64bitモードでの動作の結果なので、32bitモードでは多少性能は下がることになるが、それはOpteronも同じ事だから、かなり高速に動作する事に変わりはない。また、MotorolaのMPC7400(最初のPowerPC G4プロセッサ)は500MHz動作で1210 Dhrystone MIPSと公表されており、一方PPC970は1.8GHz駆動で5220 Dhrystone MIPSとなっており、仮に同一クロックで比較するならば2割ほど高速となっている。

Photo14:1.8GHz動作でも42W程度の消費電力だから、昨今のx86系ハイエンドプロセッサと比べると随分涼しい(?)マシンになりそうだ。

問題は登場時期だ。サンプル出荷が来年第2四半期、量産が来年後半というのは、つまりAppleからこれを搭載した新製品が出るまであと1年待たなければいけないという話になる。現時点で比べる限り、PPC970の性能は殆どのデスクトップ向けプロセッサを凌駕しているが、1年後には当然他のプロセッサは更にパフォーマンスアップしてくる。また最初から1.8GHz品が量産できるわけもなく、当初は1.4GHzあたりのみで、高クロック品はその後ということになるだろう。それまでの間、Appleの新製品はどうすればいいのか? という疑問は当然でてくることになる。また、1.4GHz~1.8GHzで周波数が打ち止めだとすると、その先に続く製品展開で当然またもや行きづまるわけで、現状の「高クロック製品が出ない」という状況が改善する見込みが薄いことになる。

もっともこれは多分にx86マーケット的な考え方であり、Macの場合はそれでも許容されるのかもしれない。ただ、「より高速なプロセッサを!」という欲求があるのはAppleのユーザーも同じであり、来年後半まで新プロセッサが出ない、という状況をAppleがどう考えているのか、興味あるところだ。

(大原雄介)

【NewsSpecial】MPF 2002 レポート
http://pcweb.mycom.co.jp/news/special/2002/10/16/02.html

アップル、PowerMac G4のラインナップを大幅強化 ハイエンドは1GHzデュアル
http://pcweb.mycom.co.jp/news/2002/01/29/11.html

米モトローラ、SOI技術による初の1GHz PowerPCプロセッサ「MPC7455」発表
http://pcweb.mycom.co.jp/news/2002/01/29/12.html



転職ノウハウ

あなたが本領発揮できる仕事を診断
あなたの仕事適性診断

シゴト性格・弱点が20の質問でサクッと分かる!

「仕事辞めたい……」その理由は?
「仕事辞めたい……」その理由は?

71%の人が仕事を辞めたいと思った経験あり。その理由と対処法は?

3年後の年収どうなる? 年収予報
3年後の年収どうなる? 年収予報

今の年収は適正? 3年後は? あなたの年収をデータに基づき予報します。

激務な職場を辞めたいが、美女が邪魔して辞められない
激務な職場を辞めたいが、美女が邪魔して辞められない

美人上司と可愛い過ぎる後輩に挟まれるエンジニアの悩み

人気記事

一覧

イチオシ記事

新着記事

[宮沢りえ]黒のシースルードレスで華やかに 「ジャングル・ブック」歌舞伎座プレミア
[22:12 7/27] エンタメ
デルのゲーミングブランド「ALIENWARE」 - その歴史、思想、戦略
[21:41 7/27] パソコン
サイコム、GeForce GTX 1070をSLIで搭載した超ハイエンドゲーミングBTO
[21:40 7/27] パソコン
逆柱いみりの画集「蜃楼紀」発売、台湾での個展を記念し
[21:37 7/27] ホビー
[松本幸四郎]歌舞伎座で初の洋画プレミアイベント開催に感慨 「感無量でございます」
[21:35 7/27] エンタメ

求人情報