【レポート】

COOL Chips VIII - Cellで実装したビデオデコーダのデモを公開

1 Cellはどうしてあのような設計となったのか

 
  • <<
  • <

1/2

4月20日からの22日までの3日間、横浜情報文化センターにて、省電力で高速なプロセッサに関する国際学会「COOL Chips VIII」が開催された。その最終日となる22日には、ソニー・コンピュータエンタテインメント(SCE)、東芝、IBMの三社連合で開発された、家電機器、ワークステーション、次世代プレイステーション向けのマルチコアCPU「Cellプロセッサ」に関する発表が行われた。

本稿では、当日行われたCell関連のセッションにおいて、興味深かった点を抜粋してお届けする。

COOL Chips VIII。「VIII」は第8回の開催を意味する。「COOL Chips」という名称は、北米で開催される同系学会の「HOT CHIPS」の"もじり"だとされている。

Cellはどうしてあのような設計となったのか

Cell関連の最初のセッションとなったのは「New Challenge in Micro Architecture and Compiler Design」と題されたもので、ソニー・コンピュータエンタテインメント半導体事業本部マイクロプロセッサー開発部部長の鈴置雅一氏から発表された。

ソニー・コンピュータエンタテインメント半導体事業本部マイクロプロセッサー開発部部長の鈴置雅一氏

Cellプロセッサのコア。90nm SOIプロセス。ISSCCで公開されたチップはコアサイズが221平方mm、2億3,400万トランジスタだったが、最新版では235平方mm、2億5,000万トランジスタとなり、さりげなくアップデートされている。

ここで発表されたのは、Cellプロセッサがどうして、"このような"設計になったのか、ということについて。"このような"とは以下のことを指している。

  1. マルチコア:1基の64ビットPowerアーキテクチャのPPE(Power Processor Element)と8基のSIMD構成のRISCプロセッサであるSPE(Synergistic Processing Element)からなる異種混合型マルチコア
  2. Cellの各コアは比較的シンプルな設計である
  3. 各プロセッサリソースが仮想化されている:各々のアドレス空間は独立している
  4. コンテンツ保護:SPEの孤立モードはハード的なセキュリティ構造をなす

(1)について。まずなぜマルチコアかというのは、近年注目されているポラックの法則が直接の理由となっている。1つのCPUコアにロジックを割いても、あまり性能が向上しないのであれば、CPUコアを増やす方向でロジックを使った方が効率の良い性能向上が期待できる。しかし、この構成で最大性能を得るためには、ソフトウェアをマルチスレッドに分解させる必要性が出てくる。これがTLP(スレッドレベルの並列化)だ。

CPU性能は、そのコア面積増加率の平方根程度までしか上がらない…というのが「ポラックの法則」

しかし、これに相対する法則もある。それがアムダールの法則だ。すべてのソフトウェアが、スレッドの細分化を実現できるわけではないから、そのソフトウェアを構成する命令実行を並列化することも重要になる。つまりILP(命令レベルの並列化)も無視できない……というわけだ。

CPU個数が増えてもパフォーマンス向上は、動かすソフトウェアのスレッドの個数に制限される…というのが「アムダールの法則」

AMDやインテルのCPUとは、かなり"異質"と見られるCellプロセッサだが、実は、現在のCPUの進化の方向性である「TLPとILP、双方のいいとこどりを目指した形」であるという点では同じだ。

ただ、ILPは汎用アプリの一般形態であるシングルタスクのソフトウェアを高効率実行するのに向いており、一方、TLPは映像や音声を初めとしたメディア処理系にうまく符合できる考え方だ。AMDやインテルは汎用アプリの実行効率を下げずにTLPを実装する方向で、それまでのCPUを対称型にマルチ化する道を選んでいる。一方、Cellプロセッサはゲーム機のCPU、AV家電機器のメディアプロセッサとして開発されているため、ややTLP重視の道を選んだ格好なわけだ。とはいえ、最低限のILPも実装すべく、2命令同時発行(2WAY)のスーパスカラアーキテクチャは採用している。

(1)のようになったもうひとつの理由として、鈴置氏はソフトウェア業界全体のトレンドがオブジェクト指向プログラミング(OOP)になっていることと関係が深いことについて触れている。それは、OOPでは、モジュール化された「単位プログラム」を、マルチコア化された各プロセッサに割り当てることで、高効率に処理することができるためだ。端的に言えばOOPはマルチコアと相性がよいということになる。

Cellの各SPEは128ビット長の汎用レジスタ(GPR)を128個持つ。このような巨大なレジスタファイルの実装は、実行時のレジスタ再配置等を不要とする効果がある一方で、タスク切り替えのオーバーヘッドになる可能性も併せ持つ。まさに諸刃の剣。

浮動小数点実数演算性能は重要だが、そのレイテンシ低減に根を詰めてもある点で飽和する。Cellでは、妥協できる点にデザインゴールを定めた。

どんなに浮動小数点実数演算を多用するソフトウェアでもその大半が整数処理系になる。つまり、整数処理系はパフォーマンスに直接結びつくということで最重要視した。

スーパースカラの同時命令発行数を増やしても性能向上はわずか。Cellの設計ではその効果が最も大きい2命令同時発行とした。「もっともスーパースカラ系の処理系に凝るだけのロジック予算がなかったという裏の事情もあった」(鈴置氏)

(2)については、メディア処理のプログラムは構造が単純であることを直接の理由としている。

SPEは32ビット浮動小数点実数からなる4要素ベクトル演算のパワフルな演算性能を持つが、キャッシュシステムを持たず、分岐履歴テーブルを用いた分岐予測機構なども持たない。また、SPEは2命令同時発行だが、あくまでインオーダー発行であり、相互に依存関係にある命令は発行できない。アーキテクチャは意外にかなりシンプルなのだ。

メディア処理は大量のデータがやってきてこれをリアルタイムに処理して結果を流すことが主体であるため、プログラムは簡潔で短く、複雑な構造になっていない。つまり、メディア処理を行うためのSPEとしては、演算性能は高いものが要求されるが、キャッシュシステムや命令実行の仕組みに高度なものはあまり必要ではないのだ。

SPEのパイプラインダイアグラム。偶数パイプと奇数パイプの2パイプラインがあり、2命令同時発行の形態を取る。しかし、それぞれのパイプラインには明確な実行属性があり(具体的に言えば演算系が偶数パイプ、それ以外が奇数パイプ)、効率よくILPを達成するためにはコンパイラの手助けが不可欠だ。

(3)については(2)と関係が深い。メディア処理とはつまりデータストリームのリアルタイム処理であるから、各SPEの実行は、調停処理や整合性同期などに邪魔されず、その独立実行性が確保された形態で行われる必要がある。もちろん各SPEにはMMUと非同期に動作できるDMAがあるので、調停や整合をとりつつ、なおかつメモリバスを休ませることなく最大速度でデータのやりとりができるような仕組みにはなっている。

(4)は、メディアプロセッサとしてのCellらしい機能で、著作権保護にまつわる重大な情報を取り扱うSPEは、孤立モード(Isolated Mode)で動作でき、そのSPEのローカルメモリ(ローカルストア)の内容は、他のSPEはもちろん、PPEからもアクセスできなくさせることができるのだ。つまり、そのSPEが持つ、暗号キーを別のプロセッサエレメントが取り出したり、デコード結果を横取りするようなことを、ハードウェア的に禁止することが出来るのだ。

すべてのコンテンツがフルデジタル化する流れの中で叫ばれている、著作権保護への具体的な取り組みについて、Cellプロセッサではいち早く行われているのだ。

こうしたCellプロセッサの著作権保護機構を「ホテルモデル」と呼んでいる。Cellプロセッサがホテルで各SPEは宿泊客。宿泊客(SPE)が鍵をかければ他の宿泊客(SPE)からは覗かれない。ただし、管理人であるPPEは、宿泊客の処理を中断させる権限は持つ。

  • <<
  • <

1/2

インデックス

目次
(1) Cellはどうしてあのような設計となったのか
(2) ついに明かされたCellプロセッサのプログラミングモデルの実体


転職ノウハウ

あなたが本領発揮できる仕事を診断
あなたの仕事適性診断

シゴト性格・弱点が20の質問でサクッと分かる!

「仕事辞めたい……」その理由は?
「仕事辞めたい……」その理由は?

71%の人が仕事を辞めたいと思った経験あり。その理由と対処法は?

3年後の年収どうなる? 年収予報
3年後の年収どうなる? 年収予報

今の年収は適正? 3年後は? あなたの年収をデータに基づき予報します。

激務な職場を辞めたいが、美女が邪魔して辞められない
激務な職場を辞めたいが、美女が邪魔して辞められない

美人上司と可愛い過ぎる後輩に挟まれるエンジニアの悩み

人気記事

一覧

イチオシ記事

新着記事

写真・動画共有で快進撃を続けるSnapchat、動画カメラ内蔵サングラス発表
[14:01 9/25] スマホとデジタル家電
北朝鮮で運用されているWebサイトはわずか28個と判明
[14:00 9/25] 企業IT
売れないアイドルに事務所が非情な決断……ゼノンでオクショウ原作の新連載
[13:41 9/25] ホビー
[明日のとと姉ちゃん]9月26日 第151回  常子、紙面と社内の改革宣言! そして花山は……
[13:00 9/25] エンタメ
OpenSSLにDoS攻撃の脆弱性
[13:00 9/25] 企業IT

求人情報