【MPF 2002 レポート】非x86関連もチェック(2)-65nmプロセスを目指す東芝とARM11プロセッサ第1弾

○東芝 TX99 based SoC

東芝セミコンダクター社 マイクロプロセッサ技師長の村尾豊氏

東芝は従来から、TX19/39/49/79といったMIPS32/64ベースのマイクロプロセッサを発売しており、国内ではNECのVRシリーズ(こちらも同じくMIPS32/64)とシェアを分け合っている状態である。その東芝が今回発表したのは、TX99という最新のMIPS64ベースプロセッサに周辺回路を集積したSoC(System on Chip)である。製品自体はコンシューマ家電機器をターゲットとしたもので、800MHzのCPUコアに32MbitのeDRAMをVRAM用途に集積、また各種の周辺回路を搭載したものである。

メモリインタフェースにDDR-IIあるいはFCRAMを採用したという点がちょっと目を引くが、来年第2四半期のサンプリングということを考えれば、この選択はリーズナブルである。プロセッサ部の内部構造も一般的なもの。MIPSの場合、整数演算ユニットとFPUが分離されているのがアーキテクチャの特徴で、これをそのまま引き継いだ、コンサバティブな構造である。


90nmプロセスでサンプルが開始される点に注目。ただし突込みどころはこの後に
このプロセッサコアはAmethystというコード名で呼ばれているそうだ。ちなみにパイプラインは6段である

さて、この製品の大きな特徴は、eDRAMをチップ内部に統合することだが、従来だとシリコンの上にまずロジックを集積、次いでその上にeDRAMのセルを積み重ね、さらにその上に配線層を積み上げるという方式だった。ところが今回東芝は、まずシリコンにトレンチ(溝)を彫り、そのトレンチを利用してeDRAMを構築。その上にロジックを重ね、さらにその上に配線層という構造を取る。これにより、従来だとロジックからの熱が、eDRAMが邪魔になってうまく放熱できなかった問題を解決できたとしている。

また、現在同社のプロセスは0.13μmを利用しているが、このTX99に関しては90nmプロセスでサンプリングを始め、2004年には65nmプロセスで量産を始めるという話も明らかになった。

サンプルチップの走査型電子顕微鏡写真。細長く黒い部分がトレンチだ
eDRAM、Logic共に微細化を進めてゆく。ほぼ2年で1世代という、Intelと同じ程度の頻度での世代交代が予定されている

この製品、技術的にそれほど何かイレギュラーな部分があるわけではない。東芝は以前からeDRAMに力をいれているし、TX99にしても既に定評のあるMIPS64ベースだから、これもまぁリーズナブルである。強いて言えば6段のパイプラインで800MHz動作というあたりが、プロセスのシュリンクを前提にした力技といえなくも無いが、今回はもっと力技な製品がSamsungから登場しているので、これに比べれば大人しいとすら言える。

それよりもむしろ関心が集まったのは、プロセスである。質疑応答でも「本当に2004年に65nmに移行できるのか?」といったあたりに質問が集中。実際、この手のプロセスの微細化では一番先行しているIntelやIBMにしても、90nmがやっと来年で、65nmは2005年を予定している。それより1年も前倒しで65nmプロセスが実現できれば、それは確かにものすごく画期的なことだろう。

○ARM ARM1136J-S/1136JF-S

ARMのExective Vice President of EngineeringであるSimon Segars氏

昨年のMicroProcessor Forumで、ARM V6という新しいアーキテクチャの詳細を発表したARMだが、今回はこのARM V6に準拠したARM11プロセッサの最初の製品、ARM1136J(F)-Sが発表された。

さてARM V6とその前のARM V5の主な違いを簡単にまとめると
・キャッシュ構造の変更とSIMD/Media命令のサポート
・マルチプロセッサのサポート
・割り込み構造の拡張、Dual Endianのサポート
といったところになる。命令数はトータルで77も増加しており、同一クロックで比較した場合、大幅に性能が改善されるというのがARM V6の特徴である。

そのARM V6だが、ARM自体はソフトコア、つまりハードウェアになる前の、言わば設計データを売るのがメインのビジネスであり、必ずしもチップ自体を売ることはビジネスとしていない。実際、昨年の時点でIntelとTIはこのARM V6のアーキテクチャライセンスを購入しており、その限りにおいては必ずしもチップを作る必要はない。が、中にはアーキテクチャではなく、実際のチップの詳細な設計図を購入するメーカーもあるわけで、こうしたベンダーのためにも、実際に動作するチップが存在しないと色々面倒なわけだ。

話を戻す。下の写真左は大雑把な内部構造を示したものだが、ARM10と比較しても周辺回路に色々変更が入っていることがわかる。またプロセッサコア自体は、パイプラインが遂に8段まで強化された。x86系プロセッサに比べれば随分少ないとも言えるが、動作クロックや命令の簡潔さを考えると、8段というのはかなり多めの部類に属する。また、メモリシステムに関しても色々と細工が加わっている。

大まかな内部ブロック図。脚注がついている部分が、新規に追加もしくは変更があった部分だ
分岐予測が85%の確率でHitするとしている。最近のハイエンドプロセッサはさらに上の数字だからそれほど大きくないとも言えるが、この手の組み込み用としては随分高い数字である
MicroTLBというのは以前からあった機構で、頻繁に発生する参照に関して高速にTLBをアクセスするための方法。言わばTLBのキャッシュ機構だ

ちょっと今回面白いと思ったのは、こうしたハードウェア側の回路の工夫よりも、割り込みに関する新しい割り切り方だ。組み込み用途の場合、リアルタイム系システムではとにかく割り込みの処理を高速に、という要求が高い。例えばブロードバンドルーターで高スループットを狙う場合、パケットの送受信に伴う処理を高速に行う必要がある。

アプリケーションによって、好きなほうを選択できる。アプリケーションプロセッサとして使うならHit-Under-Missを選択すれば良いし、デバイス制御系ならLow-Interrupt-Latencyを選択すれば割り込み応答時間が保証される

ところが、ARMのターゲットとする機器全てがこうした高い割り込み処理性能を必要としているわけではなく、むしろ多少遅くても良いから低消費電力・低発熱を求める場合もある。この相反する要求を満たすため、ARM11ではHit-Under-MissとLow-Interrupt Latencyという2種類の割り込みシステムを用意した。

また、ARM11では新たにPrimeXsysと呼ばれる開発・検証プラットフォームも同時に提供されることが明らかになっている。これは、ARM11をコアとしたSoCを開発・検証するためのテストベッドとなり、これまでより迅速に開発を行うことが可能になる。

ARMアーキテクチャの世界では、必ずしもARMコアがそのまま使われるとは限らない。例えばIntelのXScaleの場合はARM V5をベースとしているが、パイプライン構成は独自のものだし、Wireless MMXと呼ばれる独自のSIMD命令を搭載するなど、既にARM V5とのハードウェア面での互換性は少ないし、ソフトウェアの面でも非互換性がやや見られる。


ARM11コアの周囲に、メモリインタフェースやバッテリ監視回路、シリアルインタフェースやAHB(Advanced Host Bus)などを集約したもの。Windows CE、Symbian、VxWorksといったOSの動作が既にサポートされている

同様のことはTIの製品にも言えるわけで、こうした有力なライセンシーに負けないだけの性能をARM11で保持しないと、軒を貸して母屋を取られる結果になりかねない。また、これまでARMが高いシェアを誇っていた携帯電話やPDAのマーケットに、最近MIPS系プロセッサが再参入を狙っているなど、一時期ほどの圧倒的なシェアは今後望みにくい状況が発生している。直接エンドユーザーには見えない世界ではあるが、今後ARM11がどこまでシェアを確保できるか、という新たな戦いが始まったと言える。

(大原雄介)

【NewsSpecial】MPF 2002 レポート
http://pcweb.mycom.co.jp/news/special/2002/10/16/02.html

東芝セミコンダクター社
http://www.semicon.toshiba.co.jp/

ARM
http://www.arm.com/



人気記事

一覧

イチオシ記事

新着記事