Student Cluster Competitionは、6人の大学生のチームが、クラスタスパコンを作り、それで課題ソフトを実行するという競技である。課題ソフトの実行性能はもちろんであるが、審査員が、クラスタの構成や課題ソフトについてチームメンバーをインタビューし、その知識を問うとか、ポスターや実行状況の展示などの出来も評価の対象になる。課題ソフトの実行や、審査員のインタビューの結果などをすべて総合して最高の得点を得たチームが総合優勝となる。
次の図は会場に掲げられていた看板である。この一覧では、参加は15チームであるが、今年の出場チームは次の写真に示した16チームで、一覧ではジョージア工科大学が抜けている。
出場チームのブースの様子を次の写真に示す。最初のところで、大学生のチームと書いたが、実は高校生でも良く、今年はインディアナ州の「William Henry Harrison High School」という高校生チームが出場した。これまでにも高校生が出たことはあるが、全員が高校生というチームの出場は初めてであるという。また、イリノイ工科大学のチームは、2人の高校生が含まれている。
出場チームを国別にみると、米国が9チーム、中国が3チーム、台湾、シンガポール、ドイツ、ポーランドがそれぞれ1チームとなっている。相変わらず、日本からの出場はない。
各チームには、指導者が付く。これは大学の教官であるのが一般的である。システム構成の決定やアプリケーションの勉強中は指導者はいろいろな助言を行うが、競技が始まると助言は禁止で、6人の学生だけで競技を戦う。
また、各チームにはスポンサーが付き、スポンサーは競技に使用するサーバなどの機器を提供し、チームのSC会場までの旅費なども負担する。
競技に使うクラスタは、スポンサーが提供してくれるならば、何を使ってもよい。唯一の制約はクラスタ全体の消費電力が3kW以下でなければならないということである。サーバやネットワーク機器などクラスタを構成する機器の電力を取るコンセントには電流計がついており、3kWを超えた分にはペナルティがついて減点される。
もともとは48時間連続の競技であったが、今年は、11月13日の月曜の9:30amから5:30pmの間にHPCGとHPLの測定を行い、2時間空けて、7:30pmの開会宣言から水曜の5:00pmまで4種のアプリケーションの走行が行われた。
今年の課題アプリケーションは、地震波の伝搬から地層の解析を行う「Born」、分子動力学の「LAMMPS」、ベイズネットワークを解析する「MrBayes」の3つで、もう1つは、開始と同時に発表されるミステリアプリである。今年のミステリアプリは「M-Pass Atmosphere」という気象計算のアプリケーションで、南極に余剰のCO2を捨てたらどう拡散するかという計算を行わせた。
ミステリアプリは、競技開始と同時の発表であるので、事前に勉強して対策を練っておくことはできないぶっつけ本番である。また、3種の事前に発表されているアプリケーションも入力データは開始の時に配布されるので、本番データで事前に走らせてみることはできない。入力データによりアプリケーション動きが変わるので、アプリケーションの動きを勉強しておかないと、入力データに合ったチューニングを行うことができない。
また、主催者が故意の停電を発生させるので、リカバリのスキルが試される。また、その時に誰もクラスタについていないと、停電に気づかずリブートが遅れて、時間を無駄にしてしまうというリスクもある。
Student Cluster Competitionでは、LINPACKの最高性能を出したチームと、総合優勝のチームが表彰される。
今年のLINPACK性能賞は、51.77TFlopsを出したシンガポールの「Nanyang Technological University(南洋理工大学)」が受賞した。前回のISC16での最高性能は37.05TFlopsであったので、約40%性能が向上している。この向上には、NVIDIAのVolta V100 GPUの使用が大きく貢献していると考えられる。
また、Nanyangチームは、HPCGでも2.056TFlopsと他のチームを大きく引き離す性能を達成している。
さらに、Nanyangチームは総合成績でも優勝を果たした。なお、Nanyang Technological University(南洋理工大学)をご存じない読者の居られると思うが、Nanyangはアジアの理工系大学としては東大などをしのぐトップレベル評価の名門校である。
Nanyangチームは、Supermicroの4028GR-TRサーバ2台をEDR InfiniBandで接続したシステムを使った。Supermicroのサーバは、Xeon E5-2699 v4(22コア)を2ソケット搭載し、それにNVIDIAのV100 GPUを8台搭載しており、全体では、Xeon E5-2699 v4が4個、V100 GPUが16台というクラスタである。
今年は、全チームがNVIDIAのGPUを使っており、一部にP100を使用するチームもあるが、大部分のチームはV100を使っている。
CPUはPower8を使ったのが2チーム、AMDのCPUが1チームで、それ以外はXeonを使っている。システムのノード数は8ノードというチームが2チームあるが、それ以外は4ノード以下で、北京大学とMGHPCCチームは1ノードである。1ノードでもクラスタと言えるのか若干疑問ではある。