COOL Chips 20 - 基調講演で語られた世界一のスパコン「太湖之光」(2) 世界一のスパコン「神威太湖之光」のハードウェア(1)

TaihuLightのハードウェア

TaihuLightのプロセサを開発したのは、Shanghai High Performance IC Design Centerである。この開発プロジェクトは、10PFlops級のスパコンを作るためのアーキテクチャ研究ということで2006年に開始された。

最初の3年は、各種のアプリケーションの分析を行い、メニーコアのShenweiアーキテクチャの提案を行い、アーキテクチャや性能、プログラミングモデルのロードマップの策定を行った。その結果、作られたのが2011年に完成したSunway BlueLightに使われたSW1600プロセサである。そして、ロードマップに従って、2016年に完成したのがSunway TaihuLightスパコンとそれに使われたSW26010プロセサであるという。

Shenweiプロセサの開発の歴史。開発のスタートは2006年で、Sunway BlueLightのSW1600、引き続き、TaihuLightのSW26010を開発した

TaihuLightが解くべきターゲットのアプリケーションは、空間的、時間的にマルチスケールの問題、複数のコンポーネントが相互作用を持つ問題、物理的な性質から負荷バランスが悪い問題など、解きにくい問題を解くことに重点が置かれている。

それを実現するアーキテクチャとしては、コア数の増大、簡素なマイクロアーキテクチャ、性能、電力、効率を追求するものを目指したという。

TaihuLightが解くべきアプリケーションとそのためのアーキテクチャ開発

主要なアプリケーションの分析結果を次の表に示す。取り上げたアプリケーションは、行列乗算のDGEMM、疎行列の乗算のSPMV、高速フーリエ変換を行うFFT、天体の重力相互作用などを計算するNbody、暗号化のAES、グラフのサーチを行うBF-Searchである。そして、次の表では、必要な計算量とメモリアクセス回数、それらの比(演算回数/メモリアクセス回数)を纏めている。

DGEMMの演算回数はO(n³)、メモリアクセス回数はO(n²)であり、結果として演算回数/メモリアクセス回数はO(n)となる。つまり、行列のサイズnが大きくなると、それに比例して1回のメモリアクセスで実行できる演算数が増加する。このため、計算規模の割にはメモリバンド幅は小さくても良い。

一方、SPMVの場合は計算量もメモリアクセス回数もO(n)であり、大量の計算を行うためには、それに比例したメモリバンド幅が必要になる。このため、ピーク演算性能の高いTaihuLightでは、メモリバンド幅が律速になり演算性能は余ってしまう。

グラフ処理のBF-Searchも計算とメモリアクセス回数の比がO(1)の問題である。

そして、FFT、Nbody、AESはこの比がO(log(n))の問題であり、LINPACKとSPMVの中間となる性質の問題である。

主要な7種のアプリケーションの計算とメモリアクセス回数の比をまとめた表。DGEMMは演算ネックであるが、SPMVはメモリアクセスがネックになる問題である

SW26010プロセサは、次のような構造になっている。図の左上にManagement Processing Element(MPE)、右上にComputing Processing Element(CPE)のクラスタが描かれている。そして、チップ内のエレメントを接続するNetwork on Chipがあり、下側にIntelligent Memory Processing Element(IMPE)があり、IMPE経由でメインメモリが接続されている。また、チップ内ネットワークから、他のチップに接続するSystem Interface(SI)が出ている。

SW26010プロセサチップのハイレベルアーキテクチャ。OSを動かすMPE、計算処理を担当するCPEクラスタ、メモリを制御するIMPEがチップ内ネットワークで接続されている

アーキテクチャ的に、MPEの個数やCPEクラスタの個数やサイズなどはフレキシブルに変えることができるが、SW26010チップでは、MPEの数は4個、CPEクラスタの数も4個、IMPEも4個である。そして、CPEクラスタのサイズは8×8である。これらのプロセシングエレメント間を接続するチップ内ネットワークはクロスバ構造となっている。

SW26010の各エレメントの数とCPEクラスタのサイズ

CPEクラスタは8×8のアレイとなっており、2次元メッシュネットワークで接続されている。そして、各CPEにはスイッチが付いており、クレディットベースのワームホールルーティングを行う。

CPEクラスタの下側にはクラスタコントローラが描かれている。クラスタコントローラは、DMAを行うストリーミングエンジン、CPE間の同期を高速に実行する機構、MPEのキャッシュとのコヒーレンシを維持する機構などが入っている。

CPEクラスタは8×8のアレイとなっており、2次元メッシュネットワークで接続されている。クラスタコントローラは、DMAを行うストリーミングエンジン、CPE間の同期を高速に実行する機構、MPEのキャッシュとのコヒーレンシを維持する機構などが入っている

世界一のスパコン「神威太湖之光」のハードウェア(1)

TaihuLightのハードウェア

この連載の前後回

Members+ 会員限定記事

Google Geminiの活用方法第2回 Google Geminiの使い方

生成AIを戦略の軸としたGoogle Cloud、差別化は「選択肢と垂直統合」 - クリアンCEO

PagerDuty、独自開発の運用に特化した生成AIについて説明

次世代移動通信システム「5G」とは第119回ソフトバンクがPayPayドームでARの実証、先端技術より枯れた技術のBLEを選んだ理由

FinOpsを実践するメルカリ、その道のりと気づき、今後の展望 - 前編

「大阪から日本の教育を変えていく」レノボと大阪教育大学の挑戦

編集部が選ぶ関連記事

COOL Chips 20 - 富士通の12世代目となるSPARC64 XIIプロセサ

SC16 - Gordon Bell賞は中国チームが獲得

ISC 2016 - Green500の上位を独占したMIMDメニーコア第1回 Green500のトップ3を独占したMIMDメニーコア

ISC 2016 - TOP500の1位は中国の「太湖之光」、Green500の1位は日本の「菖蒲」

関連リンク

東北大、半導体とスピン素子による融合型確率論的コンピュータの性能を実証

ソフトバンクと理研が進める量子・スパコン連携は社会に何をもたらすのか？

36個のLSIによるスケーラブル全結合型イジングプロセッシングシステム、理科大が実機検証に成功

IBM Research本部のYorktown Heightsから見る、量子コンピュータの最前線

Cerebras、4兆トランジスタを搭載した第3世代WSE「WSE-3」を発表

早大など、組合わせ最適化問題を現在の量子計算機で高精度に解く手法を開発

このカテゴリーについて

世界一のスパコン「神威 太湖之光」のハードウェア(1)

TaihuLightのハードウェア

この連載の前後回

Members+ 会員限定記事

Google Geminiの活用方法 第2回 Google Geminiの使い方

生成AIを戦略の軸としたGoogle Cloud、差別化は「選択肢と垂直統合」 - クリアンCEO

PagerDuty、独自開発の運用に特化した生成AIについて説明

次世代移動通信システム「5G」とは 第119回 ソフトバンクがPayPayドームでARの実証、先端技術より枯れた技術のBLEを選んだ理由

FinOpsを実践するメルカリ、その道のりと気づき、今後の展望 - 前編

「大阪から日本の教育を変えていく」レノボと大阪教育大学の挑戦

編集部が選ぶ関連記事

COOL Chips 20 - 富士通の12世代目となるSPARC64 XIIプロセサ

SC16 - Gordon Bell賞は中国チームが獲得

ISC 2016 - Green500の上位を独占したMIMDメニーコア 第1回 Green500のトップ3を独占したMIMDメニーコア

ISC 2016 - TOP500の1位は中国の「太湖之光」、Green500の1位は日本の「菖蒲」

関連リンク

東北大、半導体とスピン素子による融合型確率論的コンピュータの性能を実証

ソフトバンクと理研が進める量子・スパコン連携は社会に何をもたらすのか？

36個のLSIによるスケーラブル全結合型イジングプロセッシングシステム、理科大が実機検証に成功

IBM Research本部のYorktown Heightsから見る、量子コンピュータの最前線

Cerebras、4兆トランジスタを搭載した第3世代WSE「WSE-3」を発表

早大など、組合わせ最適化問題を現在の量子計算機で高精度に解く手法を開発

このカテゴリーについて

世界一のスパコン「神威太湖之光」のハードウェア(1)

Google Geminiの活用方法第2回 Google Geminiの使い方

次世代移動通信システム「5G」とは第119回ソフトバンクがPayPayドームでARの実証、先端技術より枯れた技術のBLEを選んだ理由

ISC 2016 - Green500の上位を独占したMIMDメニーコア第1回 Green500のトップ3を独占したMIMDメニーコア