筑波大学 計算科学研究センターは、同センターのスーパーコンピュータ(スパコン)「HA-PACS」に新規開発した「TCA機構(密結合並列演算加速機構)」搭載部を拡張し、従来の総ピーク演算性能802TFlopsから1.166PFlopsに増強させたシステムの運用を開始したと発表した。

HA-PACS(Highly Accelerated Parallel Advanced system for Computational Sciences)は、2012年2月1日より基礎となる268台のノードで構成されるベースクラスタシステムの運用を開始した宇宙・素粒子・生命などの研究に向けた超並列演算加速器クラスタ型スパコンで、今回、独自開発によるTCA機構を備えた64台の計算ノードで構成される「HA-PACS/TCAシステム」を追加した拡張システムへとアップグレードされた。

HA-PACS/TCAの基本部分はCrayが担当し、それに同センターが開発したTCA通信機構を搭載した通信ボードを装着することで、GPU間通信性能を持った総ピーク演算性能1.166PFlopsのシステムを実現したという。TCAの各ノードごとにCPUにIntel Xeon E5-2680 v2を2基、GPUコンピューティング用にNVIDIAのTesla K20Xを4基を搭載しており、ノード単体のピーク演算性能は5.688TFlopsを達成しており、ベースのクラスタシステムと一体となった並列処理が可能だという。

またTCAは、エクサフロップス(ExaFlops)の実現を目指した超大規模並列処理におけるノード間通信のボトルネックの解消などを目的とした取り組みで、PCI Expressバスを計算ノード間通信に拡張し、ノードを超えたアクセラレータ間の直接通信を実現することで、アクセラレータの性能を最大限に引き出すことと目指している。さらに、同機構をGPUに適用することを目指し、PEACH2(PCI Express Adaptive Communication Hub ver.2)と呼ばれる通信チップと、それを搭載した通信ボードを各ノードに装着することで、多数のGPU間の通信時間を数分の一程に短縮することを可能にしており、実際にInfiniBandネットワークよりも短時間での通信ができるようになったとしている。

さらに、TCA機構が対象とするアクセラレータとしては、GPUのほかにもメニーコアプロセッサなどを利用することが可能で、研究チームでは、将来的にそういったさまざまなアクセラレータを適用させた実験も視野に入れ、そうした実証実験で培われる新しい形の並列処理や、開発されるアルゴリズムおよびアプリケーションを、次世代の超並列演算加速機構の開発につなげていきたいとしている。