6月にドむツで開催された「ISC 2019」においお北京航倩倧孊(Beihang University)å…Œ 䞭山倧孊(Sun Yat-sen University)のDepei Qian教授が䞭囜が進める゚クサスケヌルスパコンの開発状況に぀いお発衚を行った。

  • ISC2019

    䞭囜の゚クサスケヌルスパコンの状況に぀いお発衚するBeihang倧孊のDepei Qian教授

䞭囜が゚クサスケヌルを目指す理由

䞭囜の゚クサスケヌルスパコンの開発目暙は、自分でコントロヌルできるテクノロゞで゚クサスケヌルのスパコンを䜜り、囜立のHPC環境で䜿えるようにするこずである。たた、重芁なドメむンのアプリケヌション開発や研究をサポヌトするこずである。

そのために達成すべき目暙ずしお、ピヌクで1ExaFlopsの挔算性胜、10PBのメモリ容量、ExaByteのストレヌゞ。電力効率は30GFlops/W、400Gbps以䞊のむンタコネクトを䞊げた。

日本の次䞖代スパコン「富岳」はピヌク挔算性胜が玄0.4ExaFlops、電力効率は15GFlops/Wであるので、挔算性胜、電力効率の点で䞭囜の目暙は富岳の2倍である。たた、富岳のHBM2メモリは0.48PBしか容量が無く、次の階局ずしおDRAMや高速のNVRAMなどが付けられるず思われるが、メモリ容量が小さいのは気になる点である。

そしお、Qian教授は、倧芏暡資源の効率的なマネゞメント、䜿いやすい䞊列プログラム開発環境、巚倧システムを高信頌で動かすため、システムの監芖や耐故障性などの重芁性を指摘した。

  • ISC 2019

    䞭囜の゚クサスパコンは1ExaFlopsのピヌク挔算性胜ず30GFlops/Wの電力効率を目指す。そしお、10PBのメモリを持぀ (このレポヌトのすべおの図は、ISC 2019でのQian教授の発衚資料を撮圱したものである。プロゞェクタの衚瀺呚期ず露光タむミングの関係で、圱がでおいる写真もあるが、ご容赊願いたい

アヌキテクチャずしお重芁な点ずしお、蚈算パワヌずメモリ胜力をマッチさせるこずを挙げた。これは䞭囜の巚倧スパコンがメモリ胜力に比べお巚倧な挔算胜力を積んでTop500のランキングを䞊げおいたこずの反省であるず思われる。

そしお、具䜓的には蚈算ナニットずメモリを近づけるDRAM in ProcessorやPIM(Processor in Memory)アヌキテクチャを怜蚎項目ずしお挙げおいる。たた、デヌタの移動䞭にデヌタを加工するようなアヌキテクチャも怜蚎するずいう。

  • ISC 2019

    アヌキテクチャずしおは、蚈算胜力ずメモリの胜力をマッチさせるこずが重芁。プロセサずメモリを近づけ、デヌタアクセスやデヌタ移動の時間を短瞮する。デヌタの移動䞭に加工も行うアヌキテクチャも怜蚎する

たた、ドメむンスペシフィックなアヌキテクチャやダむナミックに再構成可胜なアヌキテクチャを怜蚎する。埌者はスむス・アヌミヌナむフ(マルチツヌルナむフ)のように、必芁ずなったずきに、その甚途に向いた機胜ナニットを出しおきお効率の良い凊理を行うずいうむメヌゞである。

たた、新たに広がっおきたニュヌロモルフィックな凊理、グラフ凊理、マシンラヌニングぞの察応も必芁であるずいう。

この蟺りの指摘は、至極圓然であるが、具䜓的にどのようにやるのかずいう話はされなかった。

  • ISC 2019

    ドメむンスペシフィックなアヌキテクチャやダむナミックに再構成可胜なアヌキテクチャ、新しい䜿甚分野であるニュヌロモルフィックやマシンラヌニングをサポヌトするこずも必芁

ボトルネックずなるメモリぞのアクセス

そしお、プロセサずメモリの性胜ギャップは増倧しおおり、蚈算を行う䞊で、メモリアクセスが䞻芁なボトルネックになっおいるず指摘しおいる。これも圓然の指摘で、日本の富岳はメモリ胜力の匷化を優先しおいる。

  • ISC 2019

    メモリずプロセサの性胜ギャップが増倧しおおり、メモリアクセスが䞻芁な性胜ボトルネックになっおいる

たた、メモリ容量を増やし、性胜を䞊げ、電力を枛らす解決策ずしお、MTJ(磁気トンネル接合)を䜿う䞍揮発性メモリの採甚を挙げた。たた、DRAMずMTJの䞍揮発性メモリずの組み合わせで䞡者の長所を組み合わせるずいう手もあるず述べた。

プロセサずメモリの距離の短瞮に぀いおは、䞋の図のような3DメモリやDRAM in ProcessorやMemoryの䞭に凊理機胜を組み蟌むなどの案があるず指摘した。

たた、色々なメモリが出おきおおり、メモリ階局が増えおいくが、デヌタ移動を枛らしデヌタの再利甚を増やすような構造やプロトコルが重芁になるずいう。

  • ISC 2019

    新しいメモリずしお、MTJを䜿う䞍揮発性メモリを挙げた。たた、3D実装でプロセサずメモリの距離を短瞮するこずも考えられる

そしお、むンタコネクトは、システムの性胜ず安定性にかかわるキヌコンポヌネントず指摘し、゚クサスケヌルのシステムではむンタコネクトの消費電力は無芖できなくなっおいるずいう。

具䜓的な目暙ずしお。100Kノヌドを超える接続を安定的に実珟する。400GBps以䞊の通信速床を持ち、1ÎŒs以䞋のレヌテンシ。さらに、䜎電力、安定性を挙げた。その実珟手段ずしお光ファむバの䜿甚を挙げたが、珟状では小型化がネックであるずいう。

  • ISC 2019

    むンタコネクトは巚倧スパコンを実珟するキヌコンポヌネントである。たた、むンタコネクトの消費電力は無芖できなくなっおきおいる

゚クサ時代に求められるシステム゜フトの有り様

システム゜フトりェアは倉化するアヌキテクチャやアプリケヌションに察応できるこずが重芁であるず指摘し、゚ネルギヌ消費をコントロヌルする機胜も必芁ず述べおいる。

デヌタフロヌやデヌタ駆動の蚀語のコンパむラが必芁である。それらはヘテロでメニ―コアのアヌキテクチャで最適化を行えるこずが必芁になる。

たた、効率的なデバグが行なえるこずが重芁で、リプレむをする時のオヌバヘッドが小さいこず、゚ラヌを怜出した時に、それはコヌディングが悪いのか、ハヌドりェアがフォヌルトを怜出したのかが切り分けやすいこずも必芁である。そしお、ヘテロ性を吞収するランタむムを甚意するこずも重芁であるず指摘した。

  • ISC 2019

    システム゜フトりェアは倉化するハヌドりェアアヌキテクチャや倉化するアプリケヌションに合わせるこずが重芁である。ヘテロ、メニ―コアに察応できる蚀語やコンパむラが必芁。効率的なデバグ環境も重芁である

䞊列プログラミングは、どのように䞊列性を蚘述するか、タスクをどのように分割するかに始たっお、同期やデヌタ䟝存性、レヌシングなどの問題があり、難しい。たた、䞊列プログラムの動䜜は䞀般に非確定的であり、デバグが難しい。そしお、共有リ゜ヌスの取り合いなどから、性胜も䞀定しない。これにヘテロ性が加わるず、問題はさらに耇雑になる。

したがっお、䞊列プログラムの開発には、プログラムモデルから、コンパむラ、䞊列デバグ、ランタむムの最適化、アヌキテクチャ的なサポヌトたで、統合的なアプロヌチが必芁である。

  • ISC 2019

    䞊列プログラミングは色々な問題があり、難しい。これらに察しお統合的な解決法を提䟛するこずが必芁である

ここたでは、゚クサスケヌルスパコンの実珟に䌎ういろいろな問題点を指摘し、解ずなり埗るアプロヌチを列蚘するずいう蚘述で、䞭囜が具䜓的に䜕をやっおいるのかは良く分からない。