【レポート】
かなりのベテランの読者で無いと馴染みは無いと思うが、その昔、Convexというミニスーパーコンピュータ会社があった。Convexは最終的にはHPに買われてなくなってしまったが、このConvexの創立者のSteve Wallach氏が、新たに創立したのがこのConveyである。Convexの最後の1文字がxからyに変わったというネーミングである。
ConveyのHC-1は、FSBを使うXeonマザーボードとFPGAベースのConvey開発のアクセラレータボードからなっている。このアクセラレータボードはXeonマザーボードの1つのXeonソケットに接続され、FSB経由で共通のメモリにアクセスすることができる。しかし、Xeonマザーボードのメモリではアクセラレータの必要とするメモリバンド幅を満足することは出来ないので、アクセラレータ側に16チャネルのDDR2インタフェースを持ち、合計80GBpsのメモリバンド幅を実現している。
このアクセラレータであるが、ホストインタフェースの部分が2個のVirtex-5、アプリケーションエンジンの部分が4個の大規模Virtex-5、メモリコントローラの部分が8個の中規模Virtex-5で作られている。アクセラレータの基板の写真を見ると、これらのFPGAとDIMMの他にはめぼしい部品が見られないので、アプリケーションエンジンの浮動小数点演算器を含めてロジックはすべてFPGAで実装されていると考えられる。
ホストインタフェースとメモリコントローラ部分は機能は固定であるので、ASICの方が望ましいが開発コストの点でFPGAで実装したと考えられるが、アプリケーションエンジン部分は、論理構成が可変できるFPGAの特徴を活かして、それぞれのアプリケーション向けの計算エンジンを構成することにより、汎用CPUと較べて高い性能が実現でき、優位性を持つというのがこの製品のコンセプトである。
アプリケーションエンジンとしては、32本の単精度浮動小数点演算パイプを持ち、各演算パイプは4つのFMA(浮動小数点積和)演算を実行するという汎用浮動小数点演算型、Black-Scholes方程式など金融向けの計算用に、2つの倍精度FMA演算器と乱数発生器などを持つ演算パイプを32本持つ金融型、遺伝子のマッチングを行うタンパク質シーケンシング型などが開発されている。このカリフォルニア大サンディエゴ校と共同開発されたタンパク質シーケンシング型は合計40個のマッチングロジックを持ち、Nehalemのシングルコアの100倍の性能という。
トロント大学のPaul Chow氏は、同大学が開発している「ArchES」というシステムについて発表した。科学技術計算ではMPI(Message Passing Interface)を使って処理を多数の計算ノードに分散して高速化する場合が多いが、その個々のMPIプロセスをFPGAハードウェアにマッピングして実現し、それらのブロックの間でMPI通信をしながら処理を進めるというアクセラレータ構造を提案している。
そして、このシステムでのXeonチップ間のでMPI通信性能やXeonとFPGA、FPGA同士の通信性能を測った結果が次のスライドである。
FPGAでハード実現した割りには速くないという印象であるが、ハード実現とは言え、XilinxのソフトマクロであるMicroBlazeコアを使っているので、この辺の性能がXeonと較べるとかなり低いことが影響しているようである。
このようなハードウェア間の通信にMPIのような汎用プロトコルを使う必要があるのかとも思うが、MPIで書かれたCプログラムをC-to-Gateのようなツールを使って、特にハードウェア実現の知識なしにFPGAにマッピングできるのは面白いアプローチである。なお、ハードウェアとしては、NallatchのXeon+マルチFPGAのシステムを使っている。
上の図の右側に小さな写真で示されているのがマルチFPGAモジュールであり、XilinxのVirtex-5 FPGAを1個、または2個搭載したボードを4枚重ねることができ、単精度浮動小数点演算では500GFLOPS以上、倍精度浮動小数点演算では200GFLOPS以上の性能を実現できるという。
| Hot Chips 21 - Sunの16コア256スレッドプロセサ「Rainbow Falls」 [2009/9/28] |
| Hot Chips 21 - 3次キャッシュを内蔵したIBMの8コアプロセサ「POWER7」 [2009/9/16] |
| Hot Chips 21 - モバイルプラットフォーム向けチップ技術の動向を読み解く [2009/9/7] |
| Hot Chips 21 - サーバ向けプロセサの「Magny-Cours」と「Nehalem EX」 [2009/9/3] |
【レポート】CEATEC JAPAN 2009 - 電子部品・半導体に見る先端技術
【連載】続・組み込みエンジニア必須のスキル - オシロの上級活用法を身につける 第1回 自己校正とアクティブ・プローブ校正
| 理研、脳・脊髄形成に必要な神経板湾曲の仕組みを解明 [20:16 5/25] |
| 京大、「慢性閉塞性肺疾患」患者の労作時呼吸困難は鍼治療が有効と実証 [20:08 5/25] |
| 120Hz SHVカメラ用イメージセンサーを使った撮像装置 - SHVフルスペック化へ [18:10 5/25] |
| 京大、視覚による物体認知は前頭前野からのトップダウン信号が重要と確認 [17:45 5/25] |
| 製品数の拡大だけでなくBCPの展開なども含めた総合力で事業の強化を図るTI [17:25 5/25] |
|
[東京スカイツリータウン]1/2000の模型が登場 スカイツリーやオフィス、駅など精巧に再現 [12:00 5/27] ホビー |
|
【連載】これだけは要チェック! TOEIC(R)単語帳 第106回 今回のお題は…「afterward」 [12:00 5/27] キャリア |
|
【レポート】駆け出しイラストレーターのでこ、自分のDTPスキル不足を憂うの巻 [12:00 5/27] クリエイティブ |
|
AKB48指原莉乃がアシカとコラボ!「センターになりたいです…とか言えたら」 [11:30 5/27] エンタメ |
|
更伊俊介の小説「犬とハサミは使いよう」エースでマンガ化 [11:25 5/27] ホビー |
4つの診断で、自分の適性を見つめなおそう!
働くこと・挑戦し続けることへの思いを綴ったインタビュー
あなたにピッタリのアドバイスを読むことができます。
転職に必要な情報が収集できます
企業からアプローチのメッセージが届きます。