お知らせ: プライバシーポリシーを一部改訂しました

連載

第1回

GTC 2019 - NVIDIAのDGX-2をプログラムするのに知っておくべきこと

NVIDIAのDGX-2を理解する

掲載日 2019/04/17 08:58

更新日 2019/04/18 18:23

著者：Hisa Ando

目次

1

V100 GPUからのメモリアクセス

2

NVLinkとNVSwitch

目次を開く

GTC 2019で、「All you need to know about programming NVIDIA's DGX-2」という発表が行われた。この原題は、これだけ知っていればDGX-2のプログラミングができるという意味であるが、CUDAの基本的なプログラミングの知識などは、この発表の内容を理解するためにも必要であり、この発表の知識だけ知っていれば良いとも言えないので、日本語の題としては少し弱めの題にしている。

GTC 2019で発表を行うNVIDIAのシニアアーキテクトのLars Nyland氏
GTC 2019で発表を行うNVIDIAのシステムとソフトウェアのアーキテクトのStephen Jones氏

NVIDIAのDGX-2は、10Uの筐体に16個のTesla V100 GPUを詰め込んだサーバで、これらのGPUがNVLink2でキャッシュコヒーレントに接続されている。そして、この接続を実現するため、NVIDIAは、NVSwitchというスイッチチップを開発した。

NVIDIAのDGX-2サーバ。左の写真がV100 GPUで、右の写真が18ポートのNVSwitchである。中央の写真が10Uの筐体に入ったDGX-2サーバ。DGX-2の中央の部分の上側に見える箱がベースボードで、8個のV100 GPUと6個のNVSwitchが搭載されている。このベースボードが上下に2枚あり、その下にXeon CPUなどが収容されている (この連載の資料はNVIDIAのLars Nyland氏とStephen Jones氏の発表資料のコピー)

次の図の左の写真は8台のGPUを使う仮想通貨のマイニング用の装置、右はDGX-2の写真である。多数のGPUを搭載するという点では同じであるが、この2つの装置は何が違うのであろうか？

左は8台のGPUを搭載する仮想通貨マイニング用の装置、右はDGX-2サーバである

V100 GPUからのメモリアクセス

1つのGPUの場合、SM(緑の箱)からXBAR(GPUのチップ内のクロスバ)とL2キャッシュを経由してHBMメモリをアクセスする。また、SMはXBAR、HUB、PCIe I/Oを経由してPCIeバスに接続し、CPU側のメモリをアクセスすることもできる。

1つのGPUの場合、SMからXBAR、L2キャッシュを経由してHBM2をアクセス。また、XBAR、HUB、PCIeI/O、PCIe BUSを経由してCPUのメモリをアクセスする。どちらに行くかはアクセスするメモリのアドレスによる

2つのGPUがある場合は、PCIe BUSを通って他方のGPUに行き、他方のGPUに接続されているHBM2メモリをアクセスすることもできる。しかし、他のGPUへ行くBUSはPCIeバスのバンド幅で制限され、PCIe Gen3のx16バスで32GB/s(双方向の合計)である。

2つのGPUがある場合は、PCIe BUSを経由して隣のGPUに入り、隣のGPUに接続されているHBM2メモリをアクセスできる。ただし、PCIe BUSの帯域でメモリバンド幅が制約される

次へ：

1 2

この連載の前後回

この連載のバックナンバー

新規無料会員登録はこちらから

ログイン／無料会員登録

会員サービスの詳細はこちら

AIが勧める、あなたのための会員限定記事

アクセスランキング

ランキングをもっと見る

もっと見る

編集部が選ぶ関連記事

関連リンク

※本記事は掲載時点の情報であり、最新のものとは異なる場合があります。予めご了承ください。

新着記事

こちらも注目

このカテゴリーについて

京をはじめとする日本勢もTOP500に代表されるランキングの上位に多く入ることで注目を集めるほか、人工知能(AI)やディープラーニングでも活用が進むなど、さまざまな用途で活用されるようになったスーパーコンピュータに関わるホットな話題を詳細な説明付きで紹介します。

3