TickTockモデルとSandy Bridge

同氏は、ここで、現在のNehalem系プロセッサに使われている技術などを紹介、そして、アーキテクチャとプロセスの関係を説明した。サーバ、デスクトップ、モバイル系のプロセッサは、半導体プロセスとマイクロアーキテクチャの変化がずれる「TickTock」モデルを採用し、Atom系プロセッサでは、半導体プロセスとマイクロアーキテクチャが同期している。すでに32nmプロセスでNehalemマイクロアーキテクチャが立ち上がり、今年後半には、次世代マイクロアーキテクチャであるSandy Bridgeの導入が予定されている。

Nehalemマイクロアーキテクチャを採用するプロセッサは、サーバから、高機能な組み込みまでをカバー。しかし、実際には、その多くがPC用として利用されている

プロセスとマイクロアーキテクチャの関係。CoreやXeon系のプロセッサでは、プロセスの進行とマイクロアーキテクチャの改良がずれるTickTockモデルを採用しているが、Atom系では、プロセスとマイクロアーキテクチャが同期している。今年末と言われているLincroft(Moorestown)は、Bonnellコアを採用しており、32nmへの移行は、来年以降となる予定

32nmプロセスでは、リーク電流を1/10に減らし、性能を22%工場させた。そして組み込みからサーバに対応するため、3つのプロセスバリエーションを採用している

これに対して、Atom系は、45nmのBonnellマイクロアーキテクチャで2世代目の製品となるPineViewなどの製品が登場し、今年後半には、いわゆるMoorestownプラットフォーム(プロセッサとしてLincroft)を採用した、インテルアーキテクチャのスマートフォンも登場する予定だ。

Atom系は、その後32nmプロセスを使うSaltwellマイクロアーキテクチャ(プラットフォームとしてはMedfield)へと移行する。

実は、今回のIDFの大きなテーマは、「組み込み」である。基調講演に先立ち、Intelの中国ラボの改編が発表され、組み込み系を研究の大きな柱とすることが発表されている。また、Intel自身、これまで、あまり力をいれてこなかった組み込み系への進出を狙っており、このためにBonnellコアを使うAtom系の組み込み用プロセッサを開発したり、組み込み系OSメーカーの買収などの準備を進めてきた。中国には、多くの製造メーカーがあり、組み込み系の開発もさかん。このため、組み込み系への進出のため、中国をターゲットに動き始めるというのが今回のIDFの目的でもある。

Atom系のプロセッサは、Netbook、Nettop(Entry Desktop)、Handhelds、組み込み用、家電(スマートTV用)だけでなく、もっと機能の低い組み込み用(Gadgets)までをカバー

Intelの主張するメリットは、サーバから組み込み系まで1つのアーキテクチャであり、共通のソフトウェア基盤、開発ノウハウが利用できるというもの。つまり、これらか組み込みへと進出する企業は、従来のPCの開発の延長線上で開発が行えるというわけだ。そのためのキーワードが「Compute Contiuum」なのである。

Intelの強みは、組み込みからサーバまでを1つのアーキテクチャでカバーしているため、同じ開発知識やノウハウが利用でき、ソフトウェアを共通化できる点

サーバについて説明したあと、Perlmutter氏は、次世代アーキテクチャのSandy Bridgeについて話を始めた。Sandy Bridgeは、GPUとプロセッサコアがL3キャッシュを共有し、新たな命令セットであるAVXに対応している。ここで、Perlmutter氏は、Sandy Bridgeのウェハを公開。一応、世界で初めてということになる。

次世代マイクロアーキテクチャであるSandy Bridge。内蔵グラフィックスの性能が向上し、AVX命令セットで高速な浮動小数点演算が可能。また、IPCも向上し、電力効率も上がった

Sandy Bridgeのウェハを公開

Sandy Bridgeの性能向上は、GPUの性能向上および、AVX命令に依存するところが大きい。L3キャッシュに、メモリコントローラ、CPUコア、GUPが接続れることになるため、現在のCore iシリーズよりも、グラフィックスのメモリアクセス帯域が上がり、より高速なGPUを搭載することで、グラフィックスが高速化できる。また、AVX命令は、従来のSSEの拡張であり、レジスタを256bitに拡張し、3または4オペランド命令形式を持つ。AVX以外は、パイプラインなど詳細な情報は公開されておらず、今回のIDFでも、おおまかなブロック図とCPUダイ写真が示された程度だった。ただ、Sandy BridgeによるAVXのデモは行われ、従来よりも高速な浮動小数点演算が可能になっていることを示した。

Sandy Bridgeの構成。L3キャッシュにCPUコア、GPU、そしてメモリコントローラが接続される。このため、現在のCore iシリーズに比べ内蔵GPUのメモリアクセス性能が向上する

Sandy Bridgeに搭載されているAVXのデモ。ビデオ画像のソフトウェアによる認識をAVXあり、なしで行った。6秒のビデオから運動選手の胸のマークをトラッキングし続けるもの。AVXを使うと14秒で処理が終了したが、使わない場合には、それ以上の時間がかかった