【レポート】

Fall Processor Forum 2004 - 地球シミュレータをもしのぐIBM BlueGene/L

1 設計の発想転換をしたHPC

 
  • <<
  • <

1/2

Photo01:Chief Architect, IBM T.J.Watson Research CenterのAlan Gera氏。BlueGene/Lのアーキテクチャの設計を行った方。

今年6月、最高速コンピュータのベンチマークとも言える「TOP500」の第4位にIBMのBlueGene/Lのプロトタイプが突如登場した。この時の構成は8,192プロセッサで、Rmax:11.680TFlops・Rpeak:16.384TFlopsという成績(ちなみに地球シミュレータの結果はRmax:35.860TFlops・Rpeak:40.960TFlops)であったが、これに引き続き9月には16,384プロセッサまで増やした新プロトタイプがRmaxで36.01TFlopsを発揮し、ついに地球シミュレータを抜いたという話も出ている(厳密には、次のTOP500リストが更新される11月までは、地球シミュレータが最速)。今回のFPFでは、このBlueGene/Lの詳細について最終セッション(Cool Technology)で説明があったので、この話をお届けしたい。(Photo01)

Watt/FLOPSの重要視

従来のスーパーコンピュータの場合、演算速度を上げるためにベクトル化は必須であり、従って巨大なベクトル演算プロセッサが密結合の形でメインのスカラープロセッサにぶら下がるという構造をとることが多かった。ただ、必ずしもベクトルへの最適化が十分になされない場合もあって、これに備えてスカラープロセッサもこれまた強烈なパフォーマンスを持つものが用意されるという構造だった。それがここ数年来、巨大な密結合システムから、クラスタリングを利用した疎結合プロセッサの方向に向かいつつあるのはご存知の通り。この場合、個別のプロセッサの性能自体は(密結合プロセッサの場合に比べて)それほど高くなくても問題は無いとされる。ただこれも程度問題であって、やっぱり最終的にはスカラー性能がものを言ったりする。クラスタを使う場合、データをベクトル化する代わりに多数のスレッドに分散させ、それをクラスタの各メンバに振り分ける形で処理を行うわけだが、このスレッド分散が効率的でないと1スレッドあたりの処理量が大きくなるし、また(例えば有限要素解析の様な)ある部分の計算結果がそのまま周囲のデータに影響を及ぼす類の処理では、どうしてもクラスタメンバ間でのデータのやり取りが増えるため、これをカバーするためにスカラー性能が必要になるという側面もある。

このため、クラスタをベースにしたHPC(High Performance Computer)であっても、クラスタを構成する各メンバはかなりハイパフォーマンスなCPUを利用することが一般的である。たとえば地球シミュレータは640個のPN(Processor Node)からなり、更に各々のPNは8つのAP(Arithmetic Processor)から構成される(つまりAPは全部で5,120個)が、個々のAPはというと8ユニットのベクトル演算ユニット(VU)と1つのスカラー演算ユニット(SU)から構成される。VUは計算部分の肝だから当然潤沢な演算能力を持つわけだが、SUも500MHz動作で4wayのスーパースカラー・アウトオブオーダの構造を持つそれなりにパワフルなものである。当然ながら、これだけのパフォーマンスをもたせる場合には消費電力も馬鹿にならない。APは0.15μmプロセスで製造されるが、トランジスタ数は6000万、ダイサイズは433.2平方mm(20.79mm×20.79mm)で、消費電力は平均140Wにも達している。

さて、前置きが長くなったわけだが、BlueGene/Lでは、こうした従来の発想をひっくり返すところから始まった。IBMによれば、こうした従来のアプローチでは、消費電力及びコストの面で無理があるという。要するにこうした高消費電力型プロセッサを使うと、集積度を高く上げられない(発熱が苦しくなる)し、必要とされる供給電力量も大きくなるからランニングコストも上昇する。従って、どうしても1つのラックに収められるプロセッサの数は少なくなるから、結果として設置面積が増えるし、これは配線長が大きくなる(=遅延が大きくなる)事にも繋がるという訳だ。もっと言えば予算の枠は一定な訳で、そうなれば当然イニシャルコストやランニングコストを抑える事は、トータルの計算能力を確保する上でも重要である(Photo02)。(予算青天井、なんていう景気の良い話は今時どこにもない)

Photo02:こちらはもうすこし分析が深い。従来よりも多数のノードを利用できるクラスタ対応アプリケーションが増えた結果、1ノードあたりの演算能力はもっと落としても行ける、という方向性がまずあり、そして低コストと安定性を確保するためには、消費電力と複雑な回路構成を抑えることが重要で、これを実現することで単位消費電力あたりの性能を更に引き上げられる、という仕組みだ。

こうした状況を重視してか、BlueGene/LはPowerPCのCPUコアをベースに、周辺回路をSoCで搭載する事でシステム全体の回路をシンプルにし、かつ安定度を上げようという試みである。ここでキーになるのは、SoCを使ってインタフェースを全て統合してしまうことだ。例えばCray Inc.のRed Stormの場合、CPUにOpteronをそのまま利用している関係で、インタフェースをCPUの外側に用意する必要がある。従ってプロセッサボードは当然大型化するし、部品点数も増えるからMTBFも短くなる。全てをワンチップに収めた方が、当然小型化されるしMTBFも伸び、安定度が高まるという訳だ。ただし、いかにSoCとはいえ、周辺回路を全部統合するとダイサイズは肥大化しがちである。これを抑えるためには、CPUコアにあまり大きなものを使うことは出来ない。IBMといえばPowerシリーズのCPUがまず思い浮かぶわけであるが、これは余りに回路規模が大きいのでSoCには不向きである。(というか、そもそもPowerシリーズはSoCを前提とした設計はなされていない。作り変えることは可能だろうが、回路規模を考えるとあまり現実的ではないだろう)そこで、という訳でもないのだろうが、採用されたのはもっと規模の小さなPowerPCである。これであれば、確かにダイサイズの肥大化は抑えることができるだろう(Photo03)。

Photo03:最初から周辺回路を統合する前提でSoCの利用が最初にあり、そこから必然的にPowerPCの採用が導き出されたという話でもある。もっとも、システムレベルでのRAS機能は持っていないから、これは今回新規に作りこむ必要があった訳だ。

さて、その結果としてBlueGene/Lはどんな構成を目指したかというと、65536個のプロセッサノードからなり、180~360TFlopsをターゲットとする構成である(Photo04)。最小単位は2つのプロセッサが載ったCPUカード(これがノードである)で、それが2枚とメモリが搭載されたのがCompute Cardと呼ばれる。このCompute Cardが16枚搭載されたのがNode Boardという訳だ。BlueGene/LはこのNode Boardを32枚搭載したキャビネット64台から構成される。つまりプロセッサの数は

2×2×16×32×64=131,072個

となるわけだ(Photo05)。

Photo04:今回新規に開発したASICはノード用とリンク用の2つだけ、というのは(従来のクラスタマシンでは大量にASICを作りこんでいた事を考えると)画期的な部分である。

Photo05:もっともこれはCompute Nodeのみで、実際はストレージも必要だからもう少しサイズは増えると思う。ただ例えば地球シミュレータの場合、計算ノードだけで320キャビネット、Cray Inc.のRedStomeですら108キャビネットだから、いかにキャビネットの数が少ないか判るというものだ。

これだけの数ともなれば、どうやってノード同士を接続するかが重要なポイントになるわけであるが、BlueGene/Lでは、同時に5種類のネットワークで接続されている。ノード間の通信には3次元のトーラス構造で接続されたリンクを使い、ネットワークや割り込みなどにはツリー構造のリンクを、システム制御にはスター型のリンクをそれぞれ利用するという仕組みだ(Photo06)。

Photo06:通常は、ノード間の接続には高速・広帯域のリンクを用意し、全てこれで賄うのが普通である。これは見かけはシンプルであるが、実際には高速・広帯域のリンクを作るのが大変という問題があり、全体の複雑さを増すことになっていた。ところがBlueGene/Lでは目的に応じて異なる接続方法を用意することで、回路的にはシンプルになっている。

  • <<
  • <

1/2

インデックス

目次
(1) 設計の発想転換をしたHPC
(2) 搭載するのは1999年発表のPowerPC 440


転職ノウハウ

あなたが本領発揮できる仕事を診断
あなたの仕事適性診断

シゴト性格・弱点が20の質問でサクッと分かる!

「仕事辞めたい……」その理由は?
「仕事辞めたい……」その理由は?

71%の人が仕事を辞めたいと思った経験あり。その理由と対処法は?

3年後の年収どうなる? 年収予報
3年後の年収どうなる? 年収予報

今の年収は適正? 3年後は? あなたの年収をデータに基づき予報します。

激務な職場を辞めたいが、美女が邪魔して辞められない
激務な職場を辞めたいが、美女が邪魔して辞められない

美人上司と可愛い過ぎる後輩に挟まれるエンジニアの悩み

人気記事

一覧

イチオシ記事

新着記事

国土交通省、東京のタクシー初乗り運賃を410円に引き下げる実証実験を実施
[15:30 7/28] ホビー
中国XiaomiがWindows 10搭載ノートPC発表、13.3型と12.5型の2モデル
[15:26 7/28] パソコン
ボルボ特別仕様車「S60 / V60 D4 ダイナミックエディション」8/10販売開始
[15:13 7/28] ホビー
『アイマス』声優の平山笑美などが出演、プレスターライブが8月14日開催
[15:06 7/28] ホビー
機能性表示食品の「肝臓の健康にセラクルミン」が発売
[15:02 7/28] ヘルスケア

求人情報