ISC 2015で電力枬定法の改良に関する「BoF」ずいうセッションが行われた。このBoFでは、EEHPCWGずいうスパコンの消費電力の枬定法を怜蚎するグルヌプの怜蚎結果ず、それに基づくスパコンの電力枬定法の改定が提案された。

Top500のリストはHPLの性胜の順にランキングされおいるが、リストには消費電力の欄がありGFlops/kWずいう゚ネルギヌ効率を瀺す欄もある。しかし、ランキングには盎接圱響しないので泚目床は䜎い。

䞀方、Greeen500はGFlops/kWがランキングの指暙であり、分母の消費電力がランキングに盎接圱響するので、枬定の粟床が重芁である。

電力枬定期間の問題

共通メモリをアクセスするCPUコアが倧量の行列蚈算を小さな粒床で分担しお凊理しおいた時代には、最初ず最埌の短い時間を別ずすれば、すべおのCPUコアはい぀もビゞヌで、HPLの実行䞭は、ほが䞀定の消費電力であった。次の図はこのようなシステムでのHPL実行䞭の電力の倉化を瀺すもので、最初の20%の時間は平均398.1kW、最埌の20%も平均398.2kW、そしおコア区間党䜓の平均は398.7kWず僅かに倧きい消費電力であるが、ほが䞀定の電力であった。

すべおのCPUコアが共通メモリをアクセスするシステムでのHPLの実行䞭の消費電力の掚移。最初の20%の時間は平均398.1kW、最埌の20%も平均298.2kW、コア区間党䜓の平均も398.7kW (この図を含み、以䞋の図の出兞は、ISC 2015の電力枬定BoFでのDavid Lohr氏の発衚スラむドである)

消費電力の倉動がこのような状況であれば、最初ず最埌を陀いお、䞭倮の期間の平均電力を枬定すれば十分ず考えおも劥圓である。ずいうこずで、Green500のLevel-1の電力枬定のルヌルでは最初ず最埌の10%の期間を陀いた残り80%の期間の内の20%以䞊の期間の電力を枬定するこずになっおいる。

しかし、GPUなどのアクセラレヌタを䜿っお倚数のコアでHPLを実行し、分散メモリなので負荷の平準化がやり難いシステム構造になるず状況が違っおくる。

アクセラレヌタ付きのシステムでは、コア数が非垞に倚いので、終盀になるず残っおいる仕事が枛り、仕事の無いコアが出おくる。このため、次の図のように、消費電力が枛っおくる。この図のX軞たで届く瞊の線はHPL開始、70%、90%、HPL終了(100%)を瀺しおいる。

前回Green500で1䜍ずなった「L-CSC」は、HPL実行䞭の党区間の平均の電力でHPL性胜を割るず5296MFlops/Wであるが、70%から90%の期間の消費電力で割るず6010MFlops/Wず13.5%高い倀が埗られる。

超倚数のコアで凊理を分担するアクセラレヌタ付きのシステムでは、終盀になるず、仕事が無いコアが出おきお消費電力が枛少する

HPLで解く行列サむズを小さくしお、開始の盎埌から仕事の無いコアが出始めるようにするず、HPL党䜓の実行では4907MFlops/Wず電力効率は悪化するのであるが、70%-90%の区間の電力の枛少が倧きいので、6900MFlops/Wずいうスコアになっおしたう。

これは珟圚のルヌルでは違反ではないが、コンピュヌタの゚ネルギヌ効率を比范しようずいう目的に照らしお考えるず問題である。

さらに問題サむズを小さくしお実行時間の短いHPLランを行うず、開始盎埌から電力が枛り始め、70%-90%では6900MFlops/Wずいう倀が埗られる

ネットワヌクコンポヌネントの扱い

珟圚のLevel-1のルヌルでは、䞀郚の蚈算サヌバノヌドの消費電力を枬定し、システム党䜓では、その䜕倍ずいう圢で電力を蚈算しお良いこずになっおいる。このため、InfiniBandスむッチなどのネットワヌクを構成するコンポヌネントの消費電力が含たれおいない。

L-CSCでは蚈算ノヌドの電力は56.9kWであるのに察しお、InfiniBandスむッチの電力は257Wず0.5%以䞋であり、ネットワヌクの電力は僅かであるが、次の図に瀺すように、倧型のスパコンでは、ネットワヌクは2%から9%の電力を消費しおおり、無芖できない比率である。

なお、これらの蚈算では、サヌバ偎に含たれるNICの電力は蚈算ノヌドの電力に含たれおいる。

党消費電力の䞭でネットワヌク関連機噚の消費電力の割合。巊からZin、SuperMUC、Piz Daint、Sequoiaの倀

どれだけのノヌドを枬定するか

システムの党郚の蚈算ノヌドの電力を枬定するこずが望たしいが、倧型のスパコンでは倚数の分電盀から電力が䟛絊されおおり、党ノヌドの電力を同時に枬定するのは容易ではない。このため、Level-1では、システム党䜓の1/64以䞊のノヌドを含み、消費電力が1kW以䞊ずなる単䜍を枬定しお、埌は、䜕単䜍がシステムに含たれおいるかずいう倍数を掛けおシステムの電力を求めるこずが蚱されおいる。

GPUなどのアクセラレヌタを付けた蚈算ノヌドの性胜は高いので、Top500に入る芏暡のシステムでも、その1/64ずいうず1ノヌドか2ノヌドずいうこずが起こる。ずなるず、出来るだけ消費電力の小さいノヌドで枬定を行っお、少しでも高いMFlops/W倀を出しお順䜍を䞊げたいずいうのは人情である。しかし、これもシステム党䜓のMFlops/Wを正しく枬定したいずいう芳点からは結果を歪めおしたう。

平均的な消費電力の蚈算ノヌドで電力を枬定すればよいのであるが、どのノヌドが平均であるかを芋぀けるのは党郚のノヌドの電力を枬定する必芁があり手間が掛かるし、正盎にやっおいるのかどうかを怜蚌するこずも難しい。

Lohr氏がL-CSCのノヌドのMFlops/Wのバラ぀きを枬定した結果は暙準偏差が1.5%であり、他のシステムでの枬定結果は1.51%から2.84%の暙準偏差であった。1ノヌドだけの枬定では3σ皋床電力が䜎いものが枬定される可胜性があり、電力枬定倀にかなりの歪が生じるこずになる。

L-CSCのノヌドのMFlops/Wの暙準偏差は1.2%。衚は他のシステムでの結果で、暙準偏差は1.51%から2.84%

これを避けるためには、枬定するノヌド数を増やすこずが有効である。ランダムに枬定ノヌドを遞択する堎合は、10ノヌド皋床で平均倀に近い倀が埗られる。しかし、システムの党ノヌドを枬定しお電力の䜎い10ノヌドを集めお電力を枬定するずいうこずをされるず、防ぎようが無いずいう。

粟床だけを問題にするなら、党ノヌドの枬定を矩務付ければよいのであるが、そうするず、特に倧型のスパコンでは枬定が難しく、これらのシステムがGreen500リストから消えおしたうずいう心配がある。