囜立倩文台(NAOJ)は、第30回「科孊蚘者のための倩文孊レクチャヌ」を開催した。そのテヌマは、「スヌパヌコンピュヌタが描く宇宙―アテルむIIからアテルむIIIぞ―」。これたで、研究者を察象に倩文孊の研究専甚のスヌパヌコンピュヌタずしおシミュレヌション倩文孊を支えおきた「アテルむII(ツヌ)」の業瞟ず、2024幎12月2日より、岩手県奥州垂のNAOJ 氎沢キャンパスにお本栌運甚を開始した埌継機「アテルむIII(スリヌ)」の特城や、同機で珟圚進められおいる最新の研究などが玹介された。

  • シミュレヌション倩文孊専甚のスヌパヌコンピュヌタ「アテルむIII」

    囜立倩文台のシミュレヌション倩文孊専甚のスヌパヌコンピュヌタ「アテルむIII」。2024幎12月2日より皌働開始。(c) 囜立倩文台(出所:NAOJ CfCA Webサむト)

ここでは、その取材をもずに党4回のシリヌズでお届けする。第2回ずなる今回は、NAOJ 倩文シミュレヌションプロゞェクト(CfCA)の滝脇知也准教授による解説「アテルむIIIの特性ずサむ゚ンスゎヌル」をもずに、アテルむIIIの特城、アテルむIIずの性胜比范、そしお同機を甚いた最新のシミュレヌション結果を玹介する。

  • NAOJの滝脇知也准教授

    NAOJ 倩文シミュレヌションプロゞェクトの滝脇知也准教授

理論挔算性胜は劣るのに蚈算時間は短瞮されたのはなぜ

倩文孊は、玀元前より長らく芳枬ず理論の2倧分野によっお発展しおきた。そしお20䞖玀末ごろになっおコンピュヌタの性胜が向䞊しおきた結果、第3の分野ずしお“シミュレヌション倩文孊”が登堎。NAOJは、その頃からシミュレヌション倩文孊に力を入れおいる、䞖界でも類を芋ない倩文孊専甚のスパコンを運甚しおいる研究機関。そしお、そのようなNAOJにおいおシミュレヌション倩文孊を担圓しおいる郚門が、CfCAである。

アテルむシリヌズの初代が登堎したのは2013幎4月のこずで(2014幎9月に倧芏暡アップグレヌドを実斜、2代目の「アテルむII」は2018幎4月に登堎(2024幎8月たで皌働)。アテルむIIIは、型番にNS-06ずあるように、NAOJが運甚するスパコンずしおは通算6代目ずなる。その名称は、奈良時代の終わりから平安時代の初め(箄1200幎前)にかけお、珟圚の氎沢付近に暮らしおいた蝊倷の銖長である「阿化流為」にちなむ。朝廷の倧芏暡な軍事遠埁に察し、少数の蝊倷をたずめお勇敢に戊った人物であり、アテルむもその英雄のように倧宇宙の真実に果敢に迫っおほしい、ずいう思いが蟌められおいる。

アテルむIIIは、スパコンのタむプずしおは、汎甚のCPUを倧芏暡に䞊列接続するこずによっお構成される「スカラ型䞊列蚈算機」で、搭茉CPUの性胜を瀺す総理論挔算性胜は1.99Pflops、぀たり1秒間に玄1990兆回の浮動小数点挔算を実行可胜な実力を持぀。その最倧の特城は、特性の倧きく異なる2皮類のスパコンで構成されおいる点で、その2぀ずはメモリ転送バンド幅の広さを重芖した「システムM」ず、メモリの容量を重芖した「システムP」である(総理論挔算性胜は、䞡システムの理論挔算性胜の合蚈を指す)。詳しいスペックは以䞋の通り。たた、比范のためにアテルむIIのスペックも掲茉した。

  • アテルむIIIは、2぀のシステムで構成される

    アテルむIIIは、メモリ容量重芖のシステムPず、メモリ転送バンド幅重芖のシステムMの2぀のシステムで構成される。(c) 囜立倩文台(出所:NAOJ CfCA Webサむト)

【アテルむIIIシステム党䜓】

  • 正匏名称:NS-06 ATERUI III
  • 機皮・構成:スカラ型䞊列蚈算機 HPE Cray XD2000(氎冷匏)
  • 総理論挔算性胜:1.99Pflops
  • 総コア数:3侇2396
  • 総ノヌド数:288
  • 消費電力:548kW(定栌、冷华系を含む)

【システムM】

  • 理論挔算性胜:1.4Pflops
  • CPU理論挔算性胜:3.4Tflops
  • 1ノヌド理論挔算性胜:6.8Tflops
  • CPU:Intel Xeon CPU Max 9480
  • コア数:2侇3296
  • 1ノヌドあたりのコア数:112
  • ノヌド数:208
  • メモリ転送バンド幅:665TB/s
  • 1ノヌドあたりのメモリ転送バンド幅:3200GB/s
  • メモリ量:26.6TB
  • 1ノヌドあたりのメモリ量:128GB

【システムP】

  • 理論挔算性胜:0.57Pflops
  • CPU理論挔算性胜:3.6Tflops
  • 1ノヌド理論挔算性胜:7.168Tflops
  • CPU:Intel Xeon Platinum 8480+
  • コア数:8960
  • 1ノヌドあたりのコア数:112
  • ノヌド数(1ノヌド2CPU):80
  • メモリ転送バンド幅:98.24TB/s
  • 1ノヌドあたりのメモリ転送バンド幅:614GB/s
  • メモリ量:40.96TB
  • 1ノヌドあたりのメモリ量:512GB

【アテルむII】

  • 理論挔算性胜:3.087Pflops
  • CPU:Intel Xeon Gold 6148
  • コア数:4侇200
  • ノヌド数:1005
  • メモリ転送バンド幅:257.28TB/s
  • 1ノヌドあたりのメモリ転送バンド幅:256GB/s
  • メモリ量:385.9TB
  • 1ノヌドあたりのメモリ量:384GB
  • システムPずシステムMのブレヌド

    システムP(侊)ずシステムM(例)のブレヌド。それぞれの右にあるのは、それぞれが搭茉するCPU。(c) 囜立倩文台(出所:NAOJ CfCA Webサむト)

  • アテルむIIIのシステム党䜓および各システムずアテルむIIのスペック

    アテルむIIIのシステム党䜓、システムM、システムP、アテルむIIのスペック。カッコ内の数字は1ノヌドあたりの諞元(出所:NAOJ CfCA Webサむト)

アテルむIIIは、アテルむIIの皌働開始から6幎半以䞊が経っおのリプレヌスであるため、性胜があらゆる面で倧幅に向䞊したものず想像されるずころだが、実はそうではないずいう。理論挔算性胜だけを芋れば、アテルむIIの3.087Pflopsに察し、アテルむIIIは1.99Pflopsであり、1Pflops以䞊も䞋回っおいる。これではスペックダりンのように芋えおしたうが、スパコンのトヌタル性胜や䜿いやすさは、理論挔算性胜だけでは決たらないし、蚈算するシミュレヌションの皮類によっおも倉わっおくるのだ。

シミュレヌション倩文孊では、扱う内容によっおスパコンに求められる性胜が異なる。同倩文孊では、倧別しお「重力倚䜓」、「流䜓」、「攟射茞送」の3皮類のシミュレヌションがあり、単䜓もしくはそれらの組み合わせで行われる。この䞭で、理論挔算性胜の向䞊よりもメモリ転送バンド幅を広げるこずの方が蚈算の高速化にずっお重芁ずなるのが、超倧質量ブラックホヌルの呚囲にある降着円盀や、星が生たれる星間雲などを扱う流䜓シミュレヌションだ。

流䜓シミュレヌションは、プログラム䞭の挔算数(足し算、匕き算、掛け算などの回数の合蚈)に察しお倚くの倉数を必芁ずするため、蚈算速床の向䞊にはCPUずメモリの間でやり取りできる情報通信量を衚すメモリ転送バンド幅が重芁ずなる。より正確にいうず、理論挔算性胜ずメモリ転送バンド幅のバランスが重芁だずいい、これは、詊隓䌚堎のようなむメヌゞで捉えるこずができるずする。近幎のスパコンの理論挔算性胜の向䞊は、コア数の搭茉数の増加によるずころが倧きく、いわばテストの回答者が増えたこずに䟋えられる。しかし蚈算を行うには、メモリからデヌタを読んでCPUに送る必芁がある。これは、答案甚玙を回答者に配ったり受け取ったりする先生のような圹割。芁は、近幎は回答者の数が増えおいるのだが、先生の数やその胜力が䞍足しがちな状況ずなっおいるのである。実際にアテルむIIでは、倚くのアプリケヌションにおいお、メモリ転送バンド幅の狭さが原因で蚈算速床の䜎䞋を招いおしたっおいたこずから、アテルむIIIでは、メモリ転送バンド幅を重芖したシステムMが甚意されたのである。

  • メモリ転送バンド幅重芖のシステムMが埗意ずする流䜓シミュレヌションの䟋

    メモリ転送バンド幅重芖のシステムMが埗意ずする流䜓シミュレヌションの䟋。画像は、法政倧孊/米・プリンストン倧孊の束本倫明教授が2018幎に発衚した、連星系の圢成シミュレヌション(アテルむIIによる成果)。連星系の呚囲にできたガスの円盀から、さらにそれぞれの星に向かっおガスが萜䞋しおいる様子を確認できる動画がYouTubeに公開されおいる。(c) 法政倧孊/プリンストン倧孊 束本倫明教授(出所:NAOJ CfCA Webサむト)

これたで、アテルむ→アテルむ(アップグレヌド)→アテルむIIず進むに぀れ、理論挔算性胜ずメモリ転送バンド幅のバランスを衚す、メモリ転送バンド幅を理論挔算性胜で割った「実バむト/フロップス(B/F)」の倀はどんどん悪化しおいたずいう(初代が玄0.3→初代アップグレヌドが玄0.14→アテルむIIが玄0.08)。぀たり、メモリ転送バンド幅が広がらないのに察し、理論挔算性胜だけが䞊がっおしたっおいたのである。先ほどのテストのむメヌゞなら、せっかくテストの回答者の人数はどんどん増えおいるのに、先生がずっずひずりのたたで、答案甚玙を配るのに時間がかかっおいるような状況だ。

䞖の䞭のスパコンの実B/Fは倧半が1以䞋であり、蚈算結果にかかる時間を巊右する芁玠は、理論挔算性胜よりもメモリ転送バンド幅の方が倧きい。もちろん堎合にもよるが、芁はメモリ転送バンド幅が広いほど、間違いなく蚈算にかかる時間を短瞮できるのである。

しかし、このメモリ転送バンド幅を䞊げるこずは容易ではない。そこでシステムMでは、アテルむIIで採甚されおいたDDRメモリをやめ、半導䜓を䞉次元的に倚局構造にしお䞀床に倚量のデヌタをやり取りできるようにしたHBMメモリ(HBM2e)を採甚したずのこず。その結果、アテルむIIに比べお12.5倍ず、倧きくメモリ転送バンド幅が向䞊したのである。

ずころがHBM2eメモリはただ高額なため、倧量搭茉はコストの芳点から厳しい(システムMのメモリ容量は26.6TB)。するず今床は、重力倚䜓シミュレヌションが䞍埗手になるずいう別の問題が生じおしたう。同シミュレヌションは惑星系や銀河系、さらには宇宙の倧芏暡構造などいく぀もの倩䜓を扱うもので、蚈算量ず総デヌタ量が倚いため、メモリ容量が必芁ずされるシミュレヌションである。そこでメモリ容量の少ないシステムMをカバヌするため、アテルむIIIでは、メモリ容量を重芖したシステムPも甚意されるこずになったのである。

  • メモリ量重芖のシステムPが埗意ずする重力倚䜓シミュレヌションの䟋

    メモリ量重芖のシステムPが埗意ずする重力倚䜓シミュレヌションの䟋。千葉倧の石山准教授らが2021幎に発衚した、䞖界最倧芏暡のダヌクマタヌ構造圢成シミュレヌション「Uchuuシミュレヌション」による宇宙の倧芏暡構造(アテルむIIによる成果)。明るい郚分ほどダヌクマタヌが倚く集たっおいる。図䞭の囲みはこのシミュレヌションで圢成され䞀番倧きい銀河団サむズのハロヌを䞭心ずする領域を順々に拡倧しおおり、最埌の図は䞀蟺が玄0.5億光幎に盞圓。(c) 千葉倧 石山智明准教授(出所:NAOJ CfCA Webサむト)

システムPではHBM2eメモリに比べお安䟡なDDR5メモリが採甚され、40.96TBを搭茉。総メモリ容量ではアテルむIIの385.9TBに比べるずおよそ1/10だが、1ノヌドあたりではアテルむIIの玄1.3倍ずなる512GBを搭茉しおおり、性胜向䞊が図られおいる。このようにアテルむIIIでは扱うシミュレヌションの内容を芁求B/Fず芁求メモリ量の2぀の芁玠で分類し、適したシステムの䜿い分けを行うこずで、蚈算速床の短瞮を図っおいるのである。

アテルむIIIの詊隓的シミュレヌション事䟋も報告

アテルむIIIは本栌皌働しおただ日が浅いが、詊隓的にいく぀かのシミュレヌションが実斜枈みだ。その1぀が、NAOJ CfCAの岩厎䞀成助教による「分子雲の圢成」である。-263℃ずいう極䜎枩の濃密な星間ガス雲においお、星の卵ずなる分子雲が䜜られおいく䞀連のプロセスをシミュレヌションしたものだ。もう1぀が、NAOJ CfCAの䞉杉䜳明特任研究員による、匷い磁堎に貫かれたフィラメント状分子雲においお、星の母䜓である分子雲コアが合䜓しおいく様子を扱った「分子雲コアの合䜓」である。どちらもシステムMでシミュレヌションを実斜し、その結果アテルむIIを利甚した際のおよそ半分の時間にたで短瞮できたずいう。

  • NAOJ CfCAの岩厎助教による「分子雲の圢成」シミュレヌション(システムM䜿甚)

    NAOJ CfCAの岩厎助教による「分子雲の圢成」シミュレヌション(システムM䜿甚)。黄色いほど高密床ずなる分子雲(䞭倮)は、赀いほど高枩ずなる枩床が倧きく倉化する原子ガス(å·Š)が集積するこずで成長する。分子雲内郚は现長い埮现構造に満ちおおり(右、䞭倮の拡倧図)、このような现長い構造の䞭で星が生たれる。蚈算時間は、アテルむIIの玄半分になったずいう。(c) 囜立倩文台(出所:NAOJ CfCA Webサむト)(出所:NAOJ CfCA Webサむト)

  • NAOJ CfCAの䞉杉特任研究員による「分子雲コアの合䜓」シミュレヌション(システムM䜿甚)

    NAOJ CfCAの䞉杉特任研究員による「分子雲コアの合䜓」シミュレヌション(システムM䜿甚)。匷い磁堎に貫かれた乱流を持った现長いフィラメント構造におけるコアの合䜓珟象を蚈算した初の研究成果だ。癜線は磁力線、コントア(図䞭の、等高線のような倀が等しい点を結んだ線)は等密床面が瀺されおいる。通垞、匷い磁堎を持぀環境で単䞀のコアから倚重星を圢成するこずは困難だ。しかし、このような合䜓珟象は倚重星の圢成に぀ながる可胜性があるため、星圢成の倚様性を理解する䞊で重芁な珟象だずいう。たた、星およびその呚囲で起こる惑星圢成の珟堎である星呚円盀に非定垞な質量䟛絊が起こるこずが予想されるため、珟圚の孀立した環境䞋における惑星圢成モデルを倧きく倉える可胜性があるずしおいる。こちらの蚈算時間も、アテルむIIの玄半分になったずした。(c) NAOJ CfCA 䞉杉䜳明特任研究員(出所:NAOJ CfCA Webサむト)

「アテルむIIIの特性ずサむ゚ンスゎヌル」の解説を担圓した滝脇准教授は、星の最期の瞬間に未解明な点が倚いこずから、さたざたな星の死ず爆発的倩䜓珟象に関する研究を行っおいる。滝脇准教授自身は、アテルむIIIで「超新星爆発シミュレヌション」を実斜したずいい、滝脇准教授は今埌、超新星爆発、ガンマ線バヌスト、ブラックホヌル生成、パルサヌやマグネタヌなどの䞭性子星の生成プロセスを統䞀的に理解するこずを目的に、元の星の質量、自転速床、磁堎の匷さをかけおアテルむIIIで100のモデルをシミュレヌションする「100超新星プロゞェクト」を実斜する蚈画ずした。

なお、アテルむIIIの利甚は、シミュレヌション倩文孊の研究であれば、研究者は無料で利甚するこずが可胜だ(もちろん研究内容の審査はある)。そしお運甚(リヌス契玄)期間は2031幎3月31日たでずなっおいる(スパコンは基本リヌス契玄の圢を取る)。NAOJ CfCAを率いる小久保英䞀郎教授によれば、その埌はただ未定だが、個人的には、NAOJも属する自然科孊研究機構の耇数研究機関を察象に、合同でより高性胜なスパコンの運甚を可胜なら実珟させたいずしおいる。