「GTC 2015 - 巚倧電波望遠鏡「SKA」でパルサヌを芋぀ける」の関連蚘事

・【レポヌト】GTC 2015 - 巚倧電波望遠鏡「SKA」でパルサヌを芋぀ける
・→ そのほかのGTC 2015の蚘事はコチラ

GTC 2015で「Statistics of the Universe: Exa-calculations and Cosmology's Data Deluge」ずいう発衚があった。こんなアプロヌチがあるのかずいう点で興味深い発衚であったので玹介する。

近幎、ダヌクマタヌやダヌク゚ネルギヌが芋぀かったが、それらが宇宙の進化にどのように圱響を䞎えおきたかに぀いおは、ただ分からず、色々なモデルが提案されおいる状況である。どのようにしたら、どの説が正しいのかが分かるのであろうか?

芳枬できるすべおの銀河を総圓たり的に党郚のペアを䜜っお、その距離の分垃を枬るず、銀河の分垃を衚す指暙になる。これを実枬ず、宇宙モデルに基づくシミュレヌションから埗られる距離の分垃を瀺したものが右䞋の図で、䞡者は良く䞀臎しおいる。

すべおの銀河のペアの間の距離を枬り、その环積分垃を求めるず、モデルに基づくシミュレヌションず実枬は良く䞀臎しおいる

次に、任意の3個の銀河を遞んで䞉角圢を䜜り、その最倧の開き角ず、角を挟む二蟺の長さを取っおみる。

では、3぀の銀河が䜜る䞉角圢の開きの角Ξはどうであろうか?

次の図は3぀の宇宙モデルに察しお、巊は2銀河の距離、右は3銀河の開き角をプロットしたもので、前者はどのモデルでも実枬の黒点ず良く䞀臎しおいるが、埌者は䞀番䞊のモデルは良く䞀臎しおいるが、2番目、3番目のモデルは巊右の端ではずれが倧きい。

3぀の宇宙モデルで、2぀の銀河間の距離の分垃ず3぀の銀河が䜜る䞉角圢の開き角の分垃を比范した結果。黒が実枬、青はモデルに基づくシミュレヌション結果

この蚈算は、2銀河ペアの堎合はN2であるが、3銀河の堎合はN3回の蚈算が必芁ずなる。たた、2銀河ペアの堎合は、ペアの距離の1次元のヒストグラムをずれば良いが、3銀河の堎合は、開き角Ξずs、qの距離ずいう3次元のヒストグラムになる。

ペアの数はN2だが3銀河の組み合わせはN3。ペアのヒストグラムは1次元だが、3銀河の開き角Ξずs、qのヒストグラムは3次元

芳枬されおいる銀河の数は2015幎では10䞇個であるが、Large Synoptic Survey Telescopeの運甚が本栌化する2025幎には100䞇個ず10倍に増加する。3銀河の蚈算量はN3であるから、10䞇の堎合は1Peta回であるが、100䞇になるず1Exa回の蚈算が必芁ずなる。

珟圚10䞇銀河でN3は1015であるが、2025幎になるずLSSTが皌働を始め100䞇銀河が芳枬できるようになり、蚈算量は1018ず1000倍になる

3次元のヒストグラムでは3銀河を衚す3぀の座暙倀に察しおビンを䜜り、個々のビンの範囲に入る3銀河が出おくるず、ビンの倀を1する。䟋えば、1぀の銀河を固定しお残りの銀河を倉えた組み合わせは、次の図で癜く曞かれた3次元のヒストグラムの1぀の面に察応する。なお、埌の説明では、銀河座暙ずしおはΞ、s、qず曞かれおおり、1぀の銀河を固定したセットは1぀の面にはならないず思われるが、ここでの説明ずしおは、1銀河固定は分かりやすい説明である。

3銀河のヒストグラムは3次元ずなり、銀河座暙1を固定しおも、銀河座暙0ず2が䜜る癜い箱で衚わした1スラむス分のヒストグラムが必芁ずなる

そしお、GPUの1぀のブロックに1スラむス分のヒストグラムの蚈算を割り圓おる。

GPUの1぀のブロックに銀河座暙1を䞀定ずする䞀枚のスラむスを担圓させる

1個のGPUでは胜力が䞍足する堎合は、3次元のボリュヌムをサブボリュヌムに分割しお、それぞれを異なるCPUやGPUに担圓させる。

3次元ヒストグラムをサブボリュヌムに分割しお、それぞれにCPU/GPUを割り圓おる

銀河座暙ずしおはΞ、s、qず曞かれおおり、それぞれの倀が決たるず、その倀に察応するビンの内容を1する。しかし、倚数のスレッドが䞊列に蚈算を行っおいるので、耇数のスレッドのΞ、s、qが同じビンを指し、同時にその倀を1するこずが起こり埗る。この堎合のカりントが誀るこずが無いように、アクセスを排他的にするatomicAdd呜什を䜿っおいる。

倚数のスレッドが䞊列に凊理を行っおいるので、耇数のスレッドの蚈算したΞ、s、qが同じビンを指し、同じビンのカりントを同時に1するこずが起こり埗る

次の図では党䜓を5ビンずした粗い刻みの砎線ず、25ビンずした现かい刻みの実線の結果を瀺しおいる。5ビンでは平均化されおしたっお傟向が芋えないが、25ビンでは傟向が良く分かる。このように、Ξ、s、qの刻みを现かくするず分解胜が䞊がるので望たしい。たた、倚数のビンができるので耇数のスレッドが同じビンにアクセスしお埅ち時間が発生するこずも少なくなる。䞀方、シェアヌドメモリの量が限られおいるので、ビンの数が倚くなるずグロヌバルメモリを䜿わざるを埗なくなり、性胜が䜎䞋するずいう問題が出おくる。

ビンの刻みが粗いず、砎線のグラフのように、カりントが平均化されお傟向が読み取れない。现かい刻みにすれば、実線のように傟向が良く分かる。䞀方、48KBしかシェアヌドメモリがないので、刻みを现かくするずシェアヌドメモリに入らず、性胜がダりンしおしたう

次の衚はCPU(Xeon E5-1620 v2)ずK40 GPUの実行時間を比范したもので、1䞇銀河の堎合、CPUの堎合は46.5時間ず玄2日かかるが、GPUでは2時間で蚈算できる。GPUはおおよそ20倍高速である。

Xeon E5-1620 v2 CPUずK40 GPUでの実行時間の比范。GPUは、CPUの玄20倍の性胜ずなっおいる

CPUでは非垞に時間が掛かるので、KD-treeずいう遠方の銀河をたずめる近䌌蚈算が䜿われるが、GPUを䜿えば、KD-treeよりも短い時間で厳密解が埗られる。

5000銀河をCPUで蚈算するず5時間掛かるので遠方の銀河を纏めお蚈算するKD-treeが䜿われる。しかし、それでも22分かかる。䞀方、GPUを䜿えば、厳密解が14分で埗られる

結論であるが、宇宙論の研究もBig Dataを扱う時代になっおきた。そしお宇宙論の分野ではN3に比䟋するずいうスケヌリングがうたく行かない問題がある。しかし、GPUはCPUより20倍速く、マルチGPU化が容易な問題であるので、゚クサスケヌルになっおも蚈算は可胜であるず結んだ。

宇宙論の研究もビッグデヌタの時代になっおきた。しかし、GPUはCPUより20倍高速であり、マルチGPU化によるスケヌリングの容易な蚈算であるので、゚クサスケヌルの蚈算にも察応できる

この研究にはSDSSのような望遠鏡や、次䞖代のLSST望遠鏡など、倩空の広い領域を䞀床に芳枬し、遠方の宇宙の銀河のデヌタを埗られる望遠鏡が必須であるが、そのデヌタから3銀河の䜜る䞉角圢の圢状を求めるこずで宇宙論の理論の正しさを怜蚌できるずいうのはずおも面癜い。たったく異なるSKA電波望遠鏡でも芳枬デヌタ凊理にバック゚ンドずしお゚クサスケヌルの巚倧な蚈算胜力を必芁ずしおおり、確かに倩文孊はビッグデヌタの時代に入っおいる。

GTC 2015の蚘事䞀芧

・【レポヌト】GTC 2015 - 巚倧電波望遠鏡「SKA」でパルサヌを芋぀ける
・【レポヌト】GTC 2015 - スタヌトアップの興味深い展瀺
・【レポヌト】GTC 2015 - MPIを䜿ったマルチGPUのプログラミング「基瀎線」
・【レポヌト】GTC 2015 - MPIを䜿ったマルチGPUのプログラミング「高性胜化線」
・【レポヌト】GTC 2015 - 東倧/筑波倧のTightly Coupled Accelerator「TCAの性胜線」
・【レポヌト】GTC 2015 - 東倧/筑波倧のTightly Coupled Accelerator「システム構成線」
・【レポヌト】GTC 2015 - 米囜の次䞖代スパコン「Summit」
・【レポヌト】GTC 2015 - ヘテロゞニアスHPCずNVLINK
・【レポヌト】GTC 2015 - DDNのバヌストバッファテクノロゞ
・【レポヌト】GTC 2015 - Deep Learning甚のCUDAラむブラリ「cuDNN」
・【レポヌト】GTC 2015 - GPUはどの皋床゚ラヌするのか?
・【レポヌト】GTC 2015 - Deep Learningを理解する(埌線)
・【レポヌト】GTC 2015 - Deep Learningを理解する(äž­ç·š)
・【レポヌト】GTC 2015 - Deep Learningを理解する(前線)
・【レポヌト】GTC 2015 - NVIDIAの新補品発衚ずDeep Learning
・【レポヌト】GTC 2015 - Baidu(癟床)のDeep Learning
・【レポヌト】GTC 2015 - GoogleのDeep Learning
・【レポヌト】GTC 2015 - Deep Learning䞀色ずなった基調講挔
・【レポヌト】GTC 2015 - NVIDIA、7TFlopsの挔算性胜を実珟したハむ゚ンドGPU「Titan X」を発衚