【レポート】

Hot Chips 17 - パラレリズムとアーキテクチャについて活発な議論

Yoichi Yamashita  [2005/08/30]

スタンフォード大学で8月14日~16日にプロセッサなどに関するシンポジウム「Hot Chips 17」が開催された。Hot Chipsには、招待論文やパネルセッションなどを通じて、1つのテーマを掘り下げるという傾向がある。一昔前にはCISC対RISCやスーパースカラなどが取り上げられた。前々回はマルチコアへのシフトの可能性が論じられ、直後の秋のIDFでIntelがデュアルコア・プロセッサを提供する計画を発表した。ニュース性のある発表が行われることは少ないが、業界の大きな流れに関する議論が行われるという点で注目のイベントである。

今年のテーマは、マルチコアの流れの中で模索されている新たなアーキテクチャについてだ。トップバッターはPlayStation 3に採用される次世代プロセッサ「Cell」。そして全体のトリはMicrosoftがXbox 360のシステム構成に関する講演である。E3に続くPS3対Xbox 360の第2ラウンドの間に、メディアプロセッサや専門分野向けアーキテクチャ、リコンフィギュラブル・プロセッサなどのセッションなど組み込まれた。

新アーキテクチャが求められている理由の1つに、微細化に比重を置いた性能向上の効率悪化が挙げられる。そこで初日の基調講演は、IntelのWilliam Holt氏による「Facing the Hot Chip Challenge (Again)」だった。ホット(熱く)になるのを避けながら、"ホットなチップ"を開発するには……。タイトルに"Again"と付けられているのがポイントで、同氏はエンジニアたちが60年代から常に熱の問題に取り組んできたことを指摘。プロセス技術とデザインのコラボレーションが電力問題を解決するカギになると指摘した上で、歪シリコン技術、3Dスタッキング、Sleep Transistor、動的な電力制御、デュアルコア技術などを紹介した。

IntelのTechnology and Manufacturing GroupのWilliam Holt氏

130nmプロセスをベースに、プロセス技術と効率的なデザインの効果を比較

プロセス技術とデザインのコラボレーションの効果はMadison→Montecitoで証明済み

コンシューマー向けにデジタルメディアのような高い処理能力が求められる用途が出てきたのも、新アーキテクチャが必要とされる理由の1つである。「The Next Killer Application(次のキラーアプリケーション)」というパネルセッションでは、接続性やデータ同期など様々な意見が出てきたが、大きなビジネスチャンスが見込める分野としてパネリストの意見が一致したのはデジタルビデオだった。ただし、これから業界はHD時代へと突入する。CPUを中枢とした従来のアーキテクチャは、デジタルオーディオには十分に対応できたが、HDビデオを取り扱うには心許ない。目的のアプリケーションに対して総体でどれだけの処理能力が必要になるかを見積もった上で、それを実現できる新設計が必要になる。

たとえばTelairity Semiconductorは、他のチップ技術よりも少ないチップ数でH.264のリアルタイム・エンコードを可能にするチップ・アーキテクチャを発表した。これは同社独自のTelairity-1チップ・テクノロジを採用している。H.264では、動き予測において数多くのモードから最適なものを選択することで圧縮効率を高めるため、MPEG-2の数倍の演算能力が必要になる。Telairityは、1つのチップの中に、ビデオコントローラとDRAMコントローラを1つずつと、それを囲むようにベクトル/スカラ演算コア×5を配置。ベクトルメモリを通じて連係する5つのコアに、H.264のエンコーディング作業をマップして、効率的なH.264エンコーディングを実現した。Telairityによると4つのチップでH.264のエンコーディングが可能、8つのチップだと十分なヘッドルームを確保できるそうだ。

Cellの発表では、東芝がAV機器などにCellを利用するためのSCC(Super Companion Chip)を発表した。SCCは、CellシステムでリッチなAV機能とPC I/O機能を実現するための入出力インタフェースである。デジタルTVやオーディオ/ビジュアル・サーバなど、Cellを利用したソフトウエアベースのデジタル・コンシューマソリューションの実現を目指している。

SCCとCell間はデータ転送速度が最大5GB/sのFlexIOで接続されている。VRAM用となるDDR2 DRAMインタフェースを装備。ビデオ入出力やIEEE1394のほか、PCI Express、PCI、ギガビットEthernet、USB2.0×4、ATA133×2などをサポートする。SCCの内部バスは帯域予約機能を持ち、マルチタスクのリアルタイム処理において、効率良く帯域幅を割り当てることで安定したストリームを実現する。SCCの広い帯域幅とQoS機能のデモンストレーションとして、48本のMPEG-2ストリームの同時再生のデモが披露された。

Cell+SCCのリファレンスボード

48本のMPEG-2ストリームを同時再生

東芝はデモに続いて、Cool Chipsで発表したSPEスケジューリングとプログラミングについて説明した。Cellをメディアプロセッサとして利用する可能性をアピールする発表だったが、その後のQ&Aで真っ先に質問されたのは開発にかかった期間や人数についてだった。新しいアーキテクチャでは、開発の難易度が見えにくい。この点を取り上げたのが、NVIDIAのDavid Kirk氏が行った2日目の基調講演だった。

最近、汎用プロセッサでもマルチコア化で効率的に性能を引き上げられるとユーザーの間で期待されているが、マルチスレッドに対応したアプリケーションは非常に少ないのが現状である。Kirk氏は、今後5年間に出荷されるプロセッサの50%以上が複数のコアを備えるようになるというアナリストの予測を紹介した上で、「これらのデバイス向けに誰がプログラムするのか?」と指摘する。一方、Cellのように特定の目的に利用されるプロセッサでは、全てのアプリケーションがカスタムであるため、その能力を引き出せるが、開発者の負担が大きい。

同氏はパラレリズムがもたらす可能性を高く評価しながらも、急速なシフトは開発者とユーザーを混乱させるだけだと警告する。ただし、ムーアの法則に代表されるように、業界にはスケジュールに沿った性能向上が期待されている。そこでGPUとの相乗効果を提案する。

並列タスクに適したグラフィックスを扱うGPUは、すでに高い並列性を実現している。例えば、Doom 3を例に、3GHzのシングルコアPentium 4+GeForce 6600のシステムを、3.3GHzのデュアルコアのExtreme Editionにアップグレードしても大きな性能の向上は得られないが、GeForce 7800 GTX SLIにすれば400%を超える効果が得られるという。ゲームはGPUの得意分野だけに幅広く適用できる例ではないが、リアルタイム・グラフィックスのほか、ビデオ処理や物理モデリング、イメージ処理/分析など、ハイエンドの処理能力を要求する多くの分野にGPUは活用できる、とKirk氏はアピールしていた。

    関連記事

    関連サイト

    新着記事

    特設サイトの情報

    求人情報

    人気記事

    一覧

    イチオシ記事

    新着記事

    特別企画

    一覧

    転職ノウハウ

    あなたの仕事適性診断

    4つの診断で、自分の適性を見つめなおそう!

    Heroes File ~挑戦者たち~

    働くこと・挑戦し続けることへの思いを綴ったインタビュー

    はじめての転職診断

    あなたにピッタリのアドバイスを読むことができます。

    転職Q&A

    転職に必要な情報が収集できます

    スカウト転職する

    企業からアプローチのメッセージが届きます。