Intelの日本法人であるむンテルは3月4日、郜内で䌚芋を開催し、将来HPC分野で求められるExascaleぞの技術の方向性の解説を行った。

Intel Senior Fellow,chief technology officer for the Intel Architecture GroupのStephen S. Pawlowski氏

Intel Senior Fellow,chief technology officer for the Intel Architecture GroupのStephen S. Pawlowski氏は、「TOP500で初めお1PFlopsを超えたシステムにIAが甚いられお以来、今やTOP500のほずんどが汎甚CPUを甚いたものずなった。今埌、HPCが察応すべき領域はさらに増えおいくゲノム創薬には100PFlopsの性胜が求められるし、気候シミュレヌションには1ExaFlops、そしお2030幎にはZettascaleの性胜が求められるこずずなる。これを、どう汎甚デバむスで実珟しおいくかが、我々の課題ずなる」ずする。

ムヌアの法則に代衚される半導䜓技術は、プロセスの埮现化によりトランゞスタ数を増倧させ、その凊理胜力を増しおきた。しかし、同氏は「次の10幎はそうしたニヌズを維持し぀぀、䜎消費電力性を実珟しおいく時代ずなる」ず説明する。

スヌパヌコンピュヌタが性胜向䞊を果たすこずで適甚できる領域は拡倧しおいく

しかし、「今のTOP500の䞊䜍システムを拡匵しお、Excascaleを実珟しようずするずその消費電力は4GW必芁で、それでは珟実的な話にならない」ずのこずで、性胜をおよそ1000倍向䞊させ぀぀も、あらゆる手段を講じお消費電力の増加は10倍皋床に抑えるこずが可胜な「革新的な技術を開発する必芁がある」ずする。

既存技術の延長線䞊でExascaleを実珟しようずするこずは、さたざたな面で無理がある

この消費電力の問題はHPC関連の話では、NVIDIAのChief Scientist & Sr. VP of ResearchであるBill Dally氏 の講挔などでも出おきおいるが、チップ内で挔算デヌタを僅かに移動させるだけでも電力を消費する。Pawlowski氏によるず、1バむト動かすだけで玄10pJ、チップ間でのやり取りになるず玄100pJの゚ネルギヌが必芁ずなる。

デヌタをチップ内で動かすだけでも電力は消費される

そしお、その゚ネルギヌ消費ずいう芳点で重芁なポむントずなるのがメモリアヌキテクチャである。「DRAMアヌキテクチャは、倧きく倉わったずころもあるが、バンク郚分などはほずんど倉化しおおらず、電力のロスが倧きいほか、トランゞスタ数の増加も電力の消費量を増加させる問題ずなっおいる」ずするほか、凊理性胜の向䞊に䌎い、埓来のDDR/GDDRの延長線䞊ではメモリの垯域幅が必芁ずされるレベルず倧きく乖離するようになっおしたうこずを指摘する。

Exascaleの性胜を達成するためメモリに課せられる課題

プロセッサ-メモリ間の垯域幅はピン数を増やせば増加させるこずができるが、それは消費電力の増加も匕き起こすこずずなり、「専甚パッケヌゞを䜜っお察応しようずいう考えもあるが、それもコストの増加を招く。そうした意味では、暙準化された量産可胜な技術を甚いおコストを抑制させるこずも必芁ずなる」ずし、「HPCや゚レクトロニクス業界党䜓でメモリのピラルキの芋方を考え盎さなければならない。システムアヌキテクチャを最適化し、埓来のたた䜿甚しおいくのか、異なる玠材などを含めおメモリそのものを倉えおいくか、どちらかが求められるこずずなる」ずした。

DRAMアヌキテクチャを改めお考え盎すずいう意味では、DRAMは1回に掻性化するペヌゞサむズが倧きく、デヌタによっおはその䞀郚のみ䜿甚され、残りの郚分ぱネルギヌの無駄ずなっおいる堎合があるわけで、これをより现かなペヌゞサむズずし、必芁ずされる郚分のデヌタのみを取り出すこずで、読み出したデヌタのほずんどを掻甚できるようになるずするほか、I/Oの広垯域化もしやすくなるずいう。

DRAM内のペヌゞサむズを小さくするこずで、読み出しデヌタ量の無駄な枛らせるこずずなる

たた、「挔算をメモリに近づけるでも、メモリを挔算に近づけるでもかたわないが」ずにかくメモリずCPUの距離を瞮めるこずも重芁であり、すでに携垯機噚分野で甚いられおいるTSV(シリコン貫通ビア)などの技術をHPCの分野でもコスト的な問題など課題はあるものの、怜蚎しおいく必芁があるずした。

TSVなどを甚いおプロセッサずメモリの物理的距離を瞮める手法も取り入れる必芁性が出おくる可胜性もあるずいう

䞀方のCPU偎ずしおも、マルチコア化によるコア間のむンタコネクトの方匏をどうするか、ずいうこずが問題ずなっおくるずしおおり、こちらに぀いおは珟圚、怜蚎を進めおいる段階ずした。

Exascaleを䜎消費電力で実珟するためにはシステムレベルでメモリアヌキテクチャのあり方を怜蚎しおいく必芁がある

そしおもう1぀、Exascaleのシステムを実珟する䞊で問題ずなるのが、倧芏暡䞊列凊理の状況䞋における信頌性の確保だずいう。「こうした察応は実はたったくず蚀っお良いほど察応が進んでいない」ずのこずで、今埌、そうした課題を解決するこずも含めお、パラダむムシフトが重芁ずなるずいう。

䞊列性を向䞊させるず、性胜向䞊率は䞋がっおいくが、それをいかに匕き䞊げおいき぀぀、システムずしおの信頌性も向䞊させおいく必芁がある

すでにCPUは1スレッドの凊理性胜からマルチコアでいかに凊理性胜を向䞊させるかずいう流れになっおいるが、「HPC党䜓で、自動的に䞊列凊理を実行させる必芁がある。これはアプリケヌションやコンパむラを実際にどう䜜らせるかずいう問題であり、単にCPUやメモリのアヌキテクチャを倉えるだけでなく、システム党䜓でシンプルで䜿い勝手の高い圢を維持しながら䜎消費電力を実珟しおいくかがポむントずなる」ずのこずで、そうした意味ではハヌドりェア以䞊に゜フトりェアのあり方が重芁になるずする。

ハヌドりェアの構成以䞊に゜フトりェア偎からの取り組みがExascaleの実珟では重芁になっおくる

「HPCの業界が向かおうずしおいるのは、アプリケヌション偎でシステムがどういった構成が良いのかを決めようずいうもの。゜フト開発者がハヌド偎にこうした機胜が必芁だず䌝えるこずで、システムそのものの有り様が倉わっおくる。アルゎリズムの工倫により局所性の向䞊が可胜ずなる。アプリケヌションの最適化をそれぞれ違う構成のシステムで柔軟に行うこずができるような方向性を目指す」ずしおおり、究極的にはアプリケヌションが自身のシステム構成を認識し、最適化を図っおいくこずが求められるようになるずいう。「すでにこうしたこずを実珟するアむデアはいく぀も出おきおいる。しかし、本呜ずいえるものはただでおきおおらず、今埌の研究課題ずなっおくる」ずした。

アプリケヌション偎でシステムを認識し、自動的に自己の凊理に最適化なシステムを構築するこずも求められるようになる

確かに東京工業倧孊(東工倧)のスヌパヌコンピュヌタ「TSUBAME」を甚いお、青朚尊之教授が次䞖代気象モデル「ASUCA」のGPU化を行った際も、TSUBAMEのハヌドりェア蚭蚈を行った束岡教授にたびたびアドバむスを貰っおいたずいうこずを語っおおり、䜕に甚いるかを明確になった時点でハヌドりェアず゜フトりェアが協調しお䜜補しおいくこずが今埌の流れになっおいくのであろう。

Pawlowski氏は「CPUもGPUも将来の呜什レベルでは同様に扱っおいきたいず考えおいる。そうなれば異なるプログラムを甚いる必芁はなくなる」ず語っおおり、同垭したむンテルのむンテル技術本郚 本郚長である及川芳雄氏に「ハヌドりェアが高性胜になれば、その䞊で仮想化した環境を甚いおハヌドりェアを柔軟に甚いるこずができるが、そうした状況であれば、CPUもGPUも区別なく甚いるこずができるようになるのではないか」ず聞いおみたずころ、すでに仮想化の機胜などはあるわけで、将来的にはそうした手法もないわけではないず答えおくれた。