マイナビニュース | テクノロジー | スパコン/HPC | ヘッドライン(2014)(1ページ目)

ヘッドライン

2014年12月25日(木)

東大、鉄系高温超伝導が生じる仕組みをスパコン「京」を用いて解明

東京大学は12月22日、スーパーコンピュータ「京」を駆使することで、計算機の中で鉄系高温超伝導体の超伝導を再現することに成功し、さらに超伝導が起きる仕組みも明らかにしたと発表した。

[13:48 12/25]

NICT、量子通信の実現に向けた量子もつれ光の高速生成技術を開発

情報通信研究機構(NICT)は12月19日、電気通信大学と共同で、光ファイバ通信波長帯における量子もつれ光子対の生成効率を向上させる技術を開発したと発表した。

[13:44 12/25]

米国の次期フラグシップCORALスパコン - 2システムはNVIDIA、IBMチームに決定

現在、米国を代表するスパコンはTop500 2位のOak Ridge国立研究所の「Titan」や3位のLawrence Livermore国立研究所の「Sequoia」である。Sequoiaは2012年6月、Titanは2012年11月にTop500の1位を取っており、2017年には設置後5年となり更新時期を迎える。ということで、これらのスパコンを置き換えるPre Exaの次期のフラグシップスパコンを開発する「CORALプロジェクト」が進められている。

[10:00 12/25]

2014年12月19日(金)

コンピュータアーキテクチャの話 第319回 CPUに比べて圧倒的に多いレジスタ数

GPUの仕様を見ると、32論理PEあたり、数1000個の32bitレジスタを持っていると書かれている。CPUの汎用レジスタの数は16個とか32個であるので、それに比べて圧倒的に多いレジスタ数である。

[10:00 12/19]

2014年12月16日(火)

GPUとXeon Phi、どちらが計算処理アクセラレータに最適か? - 実際の実行性能を比較するワークショップを首都大学東京が開催

計算処理のアクセラレータと言えば、GPUかIntelのXeon Phi(MIC)であるが、どちらを使うのが良いのかという情報が無く選択に迷うということが多い。これに関して、首都大学東京が主催する「メニーコアステムにおける格子アプリケーション -GPUとMICの実行性能比較-」と題するミニ研究環ワークショップが開かれた。

[12:00 12/16]

SC14 - NVIDIAの示すExaScaleへの道

SC14においてNVIDIAは、「Scaling the Power Wall:A Path to Exascale」と題する論文を発表した。NVIDIAは2010年から開始されたDARPAのExtreme-Scale Computing Projectの開発を受託しており、その一環としての研究成果の発表と思われる。

[10:00 12/16]

2014年12月15日(月)

SC14 - 展示会場で見た企業・研究機関の先端技術

SC14が開催されたNew OrleansのEarnest N. Morial Convention Centerは巨大で、その4割くらいの面積での開催となったものの、それでも十分に広く、展示場を歩き回るのは大変である。SC14では、おおよそ360のブースが設けられたものの、やはり、人目をひいたのは主要企業の大きなブースであった。

[10:00 12/15]

2014年12月12日(金)

SC14 - 花盛りとなっていた「液冷技術」

SC14の展示では、CPUなどの発熱を、空気ではなく液体を使って運び出すシステムの展示が目立った。また、そのための冷却システムを販売している会社の展示も多く見られた。スパコンの高密度実装が進んだために、空気で熱を運ぶ方法では発生する熱を運びきれなくなってきたことが、その背景にある。

[10:00 12/12]

2014年12月10日(水)

SC14 - Top500に見るスパコン界の状況

恒例であるが、SC14で第44回のTop500の「BoF」が開催された。Top500というとリストの順位だけが注目されるが、その価値は単なる番付表というだけでなく、その中身を分析して行くと、スパコン界の状況が見えてくるという点が重要である。

[09:00 12/10]

2014年12月09日(火)

SC14 - Green500で1位に輝いたL-CSCシステム

SC14でのGreen500の1位に輝いたのは、ドイツのダルムシュタットにあるヘルムホルツセンターの「Lattice-CSC」というスパコンである。スコアは、5271.87MFlops/Wで初めて5GFlops/Wを超えた。2位は高エネルギー加速器研究機構(KEK)のSuiren(睡蓮)の4945.63MFlops/W、3位は東工大のTSUBAME-KFCの4447.58MFlops/Wで、4GFlops/Wを超えたのはこの3システムだけである。

[15:25 12/9]

NEC、空調電力を30%削減するデータセンター向け相変化冷却ユニットを発表

NECは12月4日、データセンター向けに、消費電力の削減を実現する相変化冷却ユニットを発表した。

[09:49 12/9]

2014年12月08日(月)

SC14 - Student Cluster Competitionはテキサス大が3連覇を達成

「Student Cluster Competition」は、学生たちにクラスタスパコンに関するHands Onの経験をさせようということで始まった競技で、当初はSCだけで行われていたが、現在では6月のISCでも開催されている。

[10:00 12/8]

2014年12月05日(金)

SC14 - 富士通の新スパコン「FX100」

富士通はSC14に合わせて新スパコン「PRIMEHPC FX100」を発表した。中身は、これまでPost FX10と呼んでいたものを、FX100という商品名にしたというだけであるが、製品発表に伴い、SC14でのベンダーフォーラムではより詳しい情報が発表された。

[10:00 12/5]

2014年12月02日(火)

SC14 - 今年のGordon Bell賞はD.E.Shawリサーチが獲得

対して与えられる賞である。賞を取ろうとする人は、成果を記述した論文を選考委員会に提出し、その中から、委員会は候補論文を選出する。

[10:00 12/2]

2014年12月01日(月)

SC14 - Gordon Bell氏による半世紀におよぶスパコンの歴史の回想

今年の「Seymour Cray Computer Engineering Award」はGordon Bell氏に贈られた。Gordon Bell氏はDEC(Digital Equipment Corp.)のエンジニアとして「PDP-6」などの設計を行い、後には開発担当のVPとして、同社の「VAX11-780スーパーミニコン」の開発などを指揮した。DECのミニコンピュータは手頃な価格で使い勝手が良く、1つの時代を作ったと言える。このようなコンピュータの開発に対する重要な貢献が今回の授賞の理由である。

[11:30 12/1]

SC14 - 日本人初、東工大の松岡教授が「Sidney Fernbach賞」を受賞

SC14の「Sidney Fernbach賞」は、HPCの革新的な使い方を行ったという業績に対して贈られる賞である。今年のSidney Fernbach賞は東京工業大学(東工大)でTSUBAMEスパコンを開発してきた松岡聡 教授に贈られた。

[11:30 12/1]

2014年11月28日(金)

コンピュータアーキテクチャの話 第318回 GPUはどうやってマルチスレッド処理を行っているか

GPUでは多数の頂点やピクセルの処理を、それぞれのスレッドで並列に実行する。つまり、演算器の数だけの、100~数1000スレッドを並列に、SIMT方式で実行する。これに加えて、歴史的なマルチスレッドマシンのところで紹介したHEPのように、多数のスレッドのグループを切り替えて順番に処理すると、同じスレッドに戻ってくるまでの時間が長くなるので、Out-of-Order実行などの複雑な制御を使わなくても、演算器のレーテンシやメモリアクセスのレーテンシを隠すことができる。

[10:00 11/28]

2014年11月27日(木)

SC14 - 参加者全員が出席する全体会議「プレナリー(Plenary)」

今回のSC14は、大会委員長のローレンスリバモア研究所のTrish Damkroger氏の挨拶で幕を開けたが、「プレナリー(Plenary)」は全員が出席する会議という意味で、同じ時間に別の発表は行われない。今回はプレナリーとして開催されたHPC Matters! や開会の挨拶、3賞の授与などを紹介したい。

[10:30 11/27]

2014年11月25日(火)

IDT、世界最高スパコンの約2倍の計算密度を有するアーキテクチャを開発

IDTは11月25日、Orange Silicon Valleyと共同で、最大16Gbpsで複数のノードを接続する独自のRapidIOインターコネクト技術を用いて、NVIDIAの低電力モバイルプロセッサ「Tegra K1」による高スケーラビリティ・低レイテンシの大型クラスタを開発したと発表した。

[16:50 11/25]

SC14 - 現行機比でラックあたり10倍の性能を目指すNECの次世代スパコン「Aurora」

2014年11月17日にNECは、SX-ACEの次世代となるベクトルスーパーコンピュータ「Aurora」の開発を開始したと発表した。SC14のExhibitor Forumという出展者の発表で百瀬氏がAuroraについて説明を行ったので、そこから概要をお伝えしたい。

[11:00 11/25]

2014年11月21日(金)

SC14 - ExaScaler/PEZY開発のKEKのスパコン「睡蓮」がGreen500で2位を獲得

11月20日に、スパコンの性能/電力を競うGreen500の新しいランキングが発表された。1位は、ドイツのGSI ヘルムホルツセンターの「L-CSC」というマシンで、高エネルギー加速器研究機構(KEK)に設置されているExaScaler/PEZYの「Suiren(睡蓮)」が、4945.6MFlops/Wで2位にランクされた。前回チャンピオンの東京工業大学のTSUBAME-KFCは4447.6MFlops/Wと前回の4389.8 MFlops/Wからスコアを伸ばしたものの3位となった。

[11:00 11/21]

2014年11月19日(水)

IMG、TFLOPS性能を実現したGPU「PowerVR Series7」を発表

Imagination Technologies(IMG)は11月18日、16~512コアのスケーリングが可能なALUを持つPowerVR Rogue GPUアーキテクチャ(Rogue7)の最新世代である「PowerVR Series7XT/XE」を発表した。

[11:28 11/19]

AlteraとIBM、FPGAアクセラレータによりPOWER 8システムの性能を向上

Alteraは11月17日(現地時間)、IBMのCoherent Accelerator Processor Interface(CAPI)を使って、POWER 8 CPUにFPGAをコヒーレント接続したFPGAベースのアクセラレーションプラットフォームを発表した。

[11:23 11/19]

2014年11月18日(火)

Intel、第3世代のXeon PhiとXeon Phi向けインタコネクト技術を発表

Intelは11月17日(米国時間)、Intel Xeon Phiプロセッサを搭載した次世代HPCシステムの構築に向けたビルディングブロックを公開した。

[17:07 11/18]

SC14 - NVIDIAが最上位の科学技術計算用GPU「Tesla K80」を発表

2014年11月17日に、開催中のSC14において、NVIDIAは最上位の科学技術計算用のGPUとなる「Tesla K80」を発表した。SC14の会場で、Tesla部門のジェネラルマネージャーのSumit Gupta氏にK80について話を聞いた。

[11:15 11/18]

スパコン性能ランキング「TOP500」 - 中国「天河2号」が4回連続1位を達成

米ルイジアナ州ニューオーリンズにて開催されているスーパーコンピュータ(スパコン)最大の学会「SC14」において、11月17日(米国時間)、スパコン処理能力ランキング「TOP500」の2014年11月版が発表された。

[11:04 11/18]

2014年11月17日(月)

NEC、次世代ベクトル型スパコンの開発を開始- 100倍以上の性能向上を目指す

NECは11月17日、2017年の発売に向けて、スーパーコンピュータ「SX-ACE」の後継機となる次世代ベクトルマシンの開発を開始したと発表した。

[13:37 11/17]

宇宙論から感染症対策まで注目分野に向けた発表が目白押し - スパコン最大の学会「SC14」が開幕

スーパーコンピュータ(スパコン)関係の最大の学会であるSC14が、開幕した。今年の開催地はNew Orleansで、ここでの開催は2010年から5年ぶりである。主催者側によると、事前登録した今年の参加者は約1万人で、昨年と同等のレベルであるという。

[10:25 11/17]

2014年11月14日(金)

コンピュータアーキテクチャの話 第317回 浮動小数点演算器の搭載により科学技術計算分野での活用が進んだGPU

グラフィックス処理で使われる座標変換やピクセルのシェーディングの計算は、当初は、少ないハードウェアで実現できる固定小数点演算を使っていたのであるが、固定小数点の数字の範囲にうまく収まるように注意して計算する必要があり、面倒であった。このため、微細化で使用できるトランジスタ数が増えてくると、浮動小数点演算器を搭載するGPUが出てきた。

[10:00 11/14]

2014年11月13日(木)

東大など、大規模シミュレーションにより新しい相転移現象を発見

東京大学は11月11日、これまで相転移が起きないと考えられてきたスピン液体と常磁性状態との間で、相転移が起きることを新しい数値計算手法を用いた大規模シミュレーションで明らかにしたと発表した。

[13:13 11/13]

2014年11月10日(月)

RSコンポーネンツ、名刺サイズのスパコン「Parallella board」を販売開始

アールエスコンポーネンツ(RSコンポーネンツ)は11月10日、米Adaptevaが開発・生産する名刺サイズのスパコンボード「Parallella board」の販売を開始すると発表した。

[15:52 11/10]

2014年11月07日(金)

KEK、1024コアプロセサと新液浸冷却手法を採用した395TFLOPSスパコンを稼働

ExaScalerとPEZY Computingは11月6日、PEZYが開発していた1024コアの低消費電力型メニーコアプロセサ「PEZY-SC」を256個使用したほか、ExaScalerが開発した完全開放型の高効率液浸冷却システム「ESLC-8」を4台用いた小型スーパーコンピュータ(スパコン)「ExaScaler-1」が高エネルギー加速器研究機構(KEK)に納入され、2014年11月1日から「Suiren(睡蓮)」という名称で稼働を開始したと発表した。

[10:00 11/7]

2014年10月31日(金)

米IBM、大手石油ガス会社とコグニティブ・テクノロジーの共同研究を開始

米IBMとスペインの石油ガス会社であるRepsolは10月31日(現地時間)、コグニティブ・テクノロジーの利用について世界初の共同研究を行うと発表した。

[17:30 10/31]

コンピュータアーキテクチャの話 第316回 GPUが高性能な理由

3Dグラフィックス処理のところで述べたように、描画には、多数の頂点の座標変換や多数のピクセルの明るさを計算する必要がある。GPUは、この大量の計算を高速に実行することを目的として作られた専用プロセサである。

[11:00 10/31]

2014年10月28日(火)

NICT、量子鍵配送に関する新理論を確立 - 鍵生成速度の原理的な限界を解明

情報通信研究機構(NICT)は10月24日、米国のレイセオンBBNテクノロジーズ、およびルイジアナ州立大学と共同で、現在実用化が進められている2地点間の量子暗号における新理論を確立し、量子鍵配送の1パルスあたりの鍵生成レートの原理的な限界を解明したと発表した。

[15:47 10/28]

2014年10月24日(金)

人がやらないことを1番最初にやる - 藤川泰彦社長が語ったヴァイナスの未来

解析ソリューションを中心としたものづくり企業の設計支援を行うサービスプロバイダのヴァイナスは10月9日、10日に東京・品川の東京カンファレンスセンターにて、プライベートカンファレンス「VINAS Users Conference 2014」を開催し、同社が取り扱う解析ソリューションなどの活用事例などの紹介を行った。同カンファレンスにおいて、自社をものづくり企業と表現する同社の代表取締役社長を務める藤川泰彦氏に、直接、同氏が目指すヴァイナスの未来の姿を聞く機会をいただいたのでそれをお届けしたい。

[10:00 10/24]

2014年10月22日(水)

浸漬液冷はHPC/スパコンの未来を救うのか? - ExaScalerが保守性に優れた完全開放型の液浸冷却システムを開発

既報の通り2014年10月14日にExaScalerが液浸の冷却システムを発表した。この冷却システムは、完全開放型で保守性に優れ、システム全体を高効率に冷却できると謳われている。

[10:00 10/22]

2014年10月17日(金)

コンピュータアーキテクチャの話 第315回 ばらばらのメモリアクセスパターンを処理する必要があるSIMT方式

SIMT方式の場合は、それぞれのレジスタ-演算器ペアが独立にアドレスを計算して、ロードやストアをロード/ストアユニットに要求してくる。そのため、ロード/ストア(Ld/St)ユニットは、このようなばらばらのメモリアクセスパターンを処理できなければならない。

[10:00 10/17]

2014年10月16日(木)

VMwareとNVIDIA、NVIDIA GRID vGPUテックプレビューの参加企業第1弾を発表

NVIDIAとVMwareは10月14日(スペイン時間)、両社が提供するNVIDIA GRID vGPUテックプレビューの早期アクセス・プログラムにAirbusグループ、CH2M HILL、MetroHealthなどが参加していることを発表した。

[14:15 10/16]

富士通、シンガポール科学技術庁らと共同で先端研究組織を設立

富士通は10月15日、シンガポール科学技術庁およびSingapore Management University(SMU)と、都市の社会課題解決のためのソリューション創出を目的とした、5年間の包括共同研究契約を締結したと発表した。

[09:00 10/16]

2014年10月15日(水)

ExaScaler、完全開放型ながら高効率冷却が可能な液浸冷却システムを発表

ExaScalerは10月14日、保守性に優れた完全開放型ながらシステム全体を高効率に冷却できる液浸冷却手法を開発したほか、併せて同手法を用いて16kWまでのシステムを冷却可能なサーバラック8Uの液浸冷却システム「ESLC(ExaScaler Submersion Liquid Cooling)-8」を開発したと発表した。

[17:57 10/15]

2014年10月03日(金)

Broadcom、クラウド規模のデータセンター向け25/100Gビットスイッチを発表

Broadcomは10月2日、クラウド規模のデータセンター向けに最適化されたスイッチ「StrataXGS Tomahawk」シリーズを発表した。

[10:32 10/3]

コンピュータアーキテクチャの話 第314回 Teslaアーキテクチャが採用した「SIMT方式」

性能を上げるために演算器の数が増えてくると、SIMDの並列数を意識してプログラムを作る必要があり、プログラムがスケーラブルにならないという問題が明らかになってきた。このため、NVIDIAのGeForce 8800 GPUではTeslaアーキテクチャと呼ぶ新しい構造を採用した。

[10:00 10/3]

2014年10月02日(木)

「ラフ集合」が新たなビッグデータの扉を開く-TEDが挑む食に対する感性分析

東京エレクトロン デバイス(TED)は8月27日に、同社が提供する献立提案サービス「Ohganic」を拡張し、献立提案アプリ「Ohganic」の配信と、同アプリにて「今日のおすすめ献立プッシュ配信サービス」の提供を開始したことを明らかにした。同サービスは、登録ユーザーの趣味・嗜好に合わせて、最適な献立を提案するというもの。これだけ聞くと、従来のビッグデータを用いたサービスと思えるが、実は大きく異なる点がある。それはアルゴリズムに「ラフ集合」を用いたところだ。

[09:00 10/2]

2014年09月25日(木)

ビットコインの仕組みに見る暗号技術とASICによる採掘技術 第7回 ビットコインが抱えるさまざまな課題

なお、最大手のプールは全体の1/4程度の発掘を行っており、これが50%を超えると、色々な問題が起こり得る。

[14:00 9/25]

2014年09月24日(水)

ビットコインの仕組みに見る暗号技術とASICによる採掘技術 第6回 専用ASICによるSHA-256の演算実行速度の向上

悪意のある採掘者が、自分の利益になるようにトランザクションの内容を改変し、そのブロックの採掘に成功して、偽りのブロックを広報することは有り得ないことではない。しかし、広報を受け取った他の採掘者は新しいブロックの正当性をチェックするので、原資となるトランザクションが無いとか、支払額に対して原資が不足しているなどの簡単に分かるごまかしは通用しない。このようなケースでは、広報された偽りのブロックは無視されてしまい、他のノードのブロックチェインには繋ぎこまれない。

[14:00 9/24]

2014年09月22日(月)

ビットコインの仕組みに見る暗号技術とASICによる採掘技術 第5回 採掘の難易度はどのように決まるのか?

ブロックの追加権を獲得するためのブロックの採掘の難易度であるが、初期の難易度1はおおよそ2の32乗回のHash計算に1回の採掘という頻度に設定されていた。しかし、採掘能力が向上するにつれて発掘頻度が増えてくるので、10分間に1回のペースを保つためには、発掘の難易度を上げて行く必要がある。難易度100は、Hash計算あたりの発掘頻度が初期の1/100となるようにターゲット値を下げるということを意味する。

[14:00 9/22]

2014年09月19日(金)

ビットコインの仕組みに見る暗号技術とASICによる採掘技術 第4回 採掘で儲けようという団体がHashの計算を繰り返すことで拡大が続く

採掘者ならだれでも、広報されたトランザクションをチェックして、新しいブロックを作り、それを元帳に書き込めるとなると、悪い採掘者が居て、トランザクションを改変したりして、それをチェック済みと偽って広報してしまうという恐れがある。このため、ブロックをブロックチェインにつなぎこむ権利、つまり、正当な取引の記録として元帳に書き込む権利を得るためには、Proof of Workという作業を行う必要がある。

[14:00 9/19]

コンピュータアーキテクチャの話 第313回 1つの命令で複数の演算器を動かす「SIMD」

この1つの命令で複数の演算器を動かすといいうやり方は「SIMD(Single Instruction stream Multiple Data stream)」と呼ばれる。

[09:00 9/19]

2014年09月18日(木)

ビットコインの仕組みに見る暗号技術とASICによる採掘技術 第3回 ビットコインの取引の正当性を確保する「採掘」

ビットコインの取引は、すべて、この支払証文(トランザクション)に記録されているので、すべての証文を保存して置き、ビットコインの移動を追跡できるようにしておけばよい。これがブロックチェインと呼ばれるビットコインの元帳である。ビットコインの支払証文が公開であるのと同じように、この元帳も公開であり、ビットコインのネットワークに加入しているメンバーは誰で見ることができる。

[14:00 9/18]

2014年09月17日(水)

1チップで3TFlopsの演算性能を実現 - PEZY Computingの1024コアプロセサ

9月5日にPEZY Computingが、1024コアのPEZY-SCの完成と事業開始を発表した。1チップで単精度浮動小数点演算性能は3TFlops、倍精度浮動小数点演算性能は1.5TFlopsという高性能のプロセサを、殆どの人は聞いたこともない日本のベンチャー企業が開発したというのは驚きである。

[17:24 9/17]

ビットコインの仕組みに見る暗号技術とASICによる採掘技術 第2回 ビットコインの世界を作るメカニズムが組み込まれている「Walletソフト」

ビットコインのネットワークに加わり、ビットコインを使うためには、Wallet(財布)というソフトを、例えば、Bitcoin Foundationからダウンロードしてインストールする必要がある。このWalletソフトにビットコインの世界を作っているメカニズムが組み込まれている。

[14:00 9/17]

日立、大規模シミュレーションを超高速実行できるスパコンを発表

日立製作所は9月16日、流体解析や気象予測などの大規模シミュレーションに高い性能を発揮するスーパーテクニカルサーバ「SR24000」シリーズを発表した。

[10:08 9/17]

2014年09月16日(火)

ビットコインの仕組みに見る暗号技術とASICによる採掘技術 第1回 ビットコインで使われている暗号技術とは?

「Bitcoin(ビットコイン)」はネット上で流通する仮想通貨の代表的なものである。ビットコインの主要取引所であったMt.Goxの破たんで大きな注目を集めたのであるが、それがどのような仕組みとテクノロジで実現されているのかはあまり理解されていない。

[16:00 9/16]

PEZY、1024コアのメニーコアプロセッサ「PEZY-SC」を開発

PEZY Computingは9月5日、新エネルギー・産業技術総合開発機構(NEDO)の平成24年度戦略的省エネルギー技術革新プログラムの支援を受ける形で、世界最大規模となる1024コアを集積しながらも省電力を実現したメニーコアプロセッサ「PEZY-SC」を開発し、本格的な事業展開を開始したと発表した。

[14:46 9/16]

2014年09月11日(木)

Hot Chips 26 - IntelのIvyBridgeサーバプロセサ「Ivytown」

Hot Chips 26において、IntelはIvyBridgeアーキテクチャのサーバプロセサ「Ivytown」について発表を行った。もう、すでにHaswellの時代になっており、なぜ、今更、旧世代のIvyBridgeの発表をするのかと思われるかも知れないが、サーバ用のE5、E7系に関してはまだHaswellアーキテクチャのコアを使う製品は出ておらず、IvyBridge系のサーバチップが最新の製品なのである。

[11:30 9/11]

2014年09月10日(水)

Hot Chips 26 - Oracle、32コアSPARC M7プロセサを発表

Hot Chips 26において、Oracleは次世代のSPARC M7プロセサを発表した。32コアという多数コアのチップで、富士通の34コアのSPARC64 XIfxと並んで、次世代SPARCは32コア+αという時代に突入した。

[10:30 9/10]

2014年09月09日(火)

インテル、DDR4メモリに対応した「Xeon E5-2600/1600 v3ファミリ」を発表

米Intel(インテル)は、さまざまなワークロードの要件と急速に変化するデータセンターのニーズに対応可能な22nmプロセス採用の次世代プロセッサ「Intel Xeonプロセッサ E5-2600/1600 v3製品ファミリ」を発表した。

[17:47 9/9]

Hot Chips 26 - MITの36コア スヌーピーメッシュプロセサ「SCORPIO」

Hot Chips 26において、MITのグループは6×6のメッシュで36コアを接続し、スヌープ方式でコヒーレンスを実現する「SCORPIO」を呼ぶプロセサを発表した。

[10:00 9/9]

2014年09月08日(月)

凸版と村田、PUF技術を搭載した世界最小クラスのICタグを共同開発

凸版印刷と村田製作所は9月5日、PUF技術を搭載した世界最小クラスのICタグを共同で開発したと発表した。

[14:42 9/8]

IMG、64ビットMIPS Warriorコア搭載のCPUファミリを発表

Imagination Technologies(IMG)は9月5日、高効率64ビットMIPS Warriorコア搭載のCPU「MIPS I-class I6400」ファミリを発表した。

[14:29 9/8]

Hot Chips 26 - ビットコインのマイニング用プロセサ「Goldstrike 1」

Hot Chips 26において、CoinTerraは「Goldstrike 1」と呼ぶビットコインのマイニング用のプロセサを発表した。

[12:21 9/8]

2014年09月05日(金)

Hot Chips 26 - Movidius、「Myriad 2」ビジョンプロセサを発表

周囲の3Dマップを作るGoogleの「Project Tango」に「Myriad 1」プロセサが採用されて、一躍、名前を知られるようになったMovidiusが、Hot Chips 26において第2世代のMyriad 2ビジョンプロセサを発表した。

[11:00 9/5]

コンピュータアーキテクチャの話 第312回 固定小数点の演算から、浮動小数点の演算へ

このように頂点シェーダやピクセルシェーダは大量の計算を行う必要がある。これらの計算は、初期には計算が簡単な固定小数点の演算が用いられたが、ピクセルの明るさなど取り得る値の範囲が大きい量を扱うには不便であるので、現在では、表せる値の範囲が広い浮動小数点の数値を用いて計算を行うというのが普通である。

[10:00 9/5]

2014年09月04日(木)

東芝、量子暗号鍵配信で世界最大の1日あたり暗号鍵配信量を達成

東芝は9月4日、量子暗号鍵配信装置を使った暗号鍵の配信実験を行い、世界最大となる1日あたりの鍵配信量を達成したと発表した。今回、東京の大手町-小金井間を結ぶ全長45kmの既設光ファイバーを用いて、1日あたりの平均鍵配信量25.8ギガビット(総鍵配信量878ギガビット)で34日間の安定した稼働を確認した。

[16:28 9/4]

Google、カリフォルニア大と共同で独自の量子コンピュータ開発へ

Googleは9月3日、カリフォルニア大学サンタバーバラ校のJohn Martinis教授の研究チームと共同で、独自の量子コンピューターの開発を開始すると発表した。

[15:39 9/4]

Hot Chips 26 - 進化を続けるFPGA

FPGAの発表はHot Chipsの恒例となった感があり、今回のHot Chips 26でもAlteraとXilinxが先端のFPGAを発表した。微細化に伴い、実現できるロジックの規模が増大し、SRAM、プロセサコア、DSPなどの部品の搭載、そして、各種の高速IOやメモリコントローラのサポートと、その有用性は急速に進歩している。

[12:00 9/4]

2014年09月03日(水)

Hot Chips 26 - Applied Microの第2世代ARMv8プロセサ「X-Gene 2」

Applied Microは、世界で一番早くARMv8アーキテクチャの「X-Gene」プロセサを完成させた会社である。そして、今回のHot Chips 26では、第2世代となる「X-Gene 2」プロセサを発表した。

[10:00 9/3]

2014年09月02日(火)

Hot Chips 26 - HynixのHBMとThruChipの磁気結合3D実装技術

Hot Chips 26では、SK HynixのJoonyoug Kim氏とYounsu Kim氏がHBMについての発表をしたほか、TSVに伴うコスト増を解決するために近距離磁気結合を使ってワイヤレスでチップ間の信号伝送を行うという技術を、ThruChip Communicationsが発表した。

[10:00 9/2]

2014年09月01日(月)

TI、サーバ・ストレージ向けにVcore電源管理システムソリューションを発表

Texas Instruments(TI)は8月29日、企業サーバ、ストレージ、ハイエンドデスクトップアプリケーション向けに、包括的なマルチフェーズコア電圧(Vcore)電源管理システムソリューションを発表した。

[13:05 9/1]

Hot Chips 26 - 第2世代の分子動力学専用スパコン「Anton2」

Hot Chips 26において、D.E.Shaw Researchは第2世代の分子動力学スパコンである「ANTON 2」について発表を行った。D.E.Shaw & Co.は、運用資産330億ドル(3兆円あまり)の世界最大級のヘッジファンドで、創立者のShaw博士は当然、大金持ちである。他にも大金持ちはいるが、ポケットマネーで専用スパコンを作っている人はShaw博士くらいのものである。

[10:00 9/1]

2014年08月28日(木)

PMC、12Gb/s対応のSASエクスパンダカード「Adaptec 82885T」を発表

PMC-Sierraは8月27日、データセンタサーバに高い拡張性と柔軟性を提供する12Gb/s対応のSASエクスパンダカード「Adaptec 82885T」を発表した。

[17:51 8/28]

Hot Chips 26 - マイクロソフトがFPGAでBingの検索を加速

Hot Chips 26において、MicrosoftはFPGAを使って、再構成可能なコンピューティングを行うデータセンターサーバについての発表を行った。

[10:00 8/28]

2014年08月27日(水)

インテル、HPC向けソフトウェア開発製品の最新版を発表

インテルは、ハイパフォーマンス・コンピューティング(HPC)およびテクニカル・コンピューティング向けソフトウェア開発製品の最新版となる「インテル Parallel Studio XE 2015 」を発表した。

[13:59 8/27]

2014年08月26日(火)

NIMSなど、同一の光子を放出する単一光子源を固体中に多数作製

筑波大学と物質・材料研究機構(NIMS)は8月21日、ダイヤモンド中のカラーセンターの1つであるSiV-センターを高純度・高結晶性ダイヤモンド薄膜成長時に、極微量の濃度に制御して導入し、単一光子源として作製することに成功したと発表した。

[10:50 8/26]

Hot Chips 26 - NVIDIAが独自開発の64bit ARMコア「Denver」を発表

Hot Chips 26においてNVIDIAは、自社開発の高性能64bit ARMコアである「Denver」を発表した。2014年の1月にNVIDIAは、ARMコアと192CUDAコアのKepler GPUを集積するモバイル用SoCであるTegra K1チップを発表した。最初の製品は、ARMコアとしては32bitアーキテクチャのCortex A15コアを4コア搭載するものであるが、自社開発のDenverという64bitアーキテクチャのコアを2コア搭載するものも、2014年の後半には登場すると発表されていた。

[10:00 8/26]

2014年08月22日(金)

コンピュータアーキテクチャの話 第311回 現在のGPUの主流となっている「ユニファイドシェーダ」

Phongシェーディングは良いモデルであるが、例えば、肌の質感や髪の毛などをうまく表現することはできない。

[10:00 8/22]

2014年08月18日(月)

Hot Chips 26 - 富士通の100PFlops級スパコン向けプロセサ「SPARC64XIfx」

富士通は、Hot Chips 26において、京コンピュータの10倍の性能の100PFlops級のスパコンを構築するための新CPU「SPARC64 XIfxプロセサ」を発表した。

[11:00 8/18]

2014年08月11日(月)

NII、理論主導でダイヤモンドを用いた量子コンピュータを実現化

国立情報学研究所(NII)は8月8日、小さなダイヤモンドのかけらを用いた量子コンピュータの基本素子のデザインや、そこからシステムへ組み上げるためのアーキテクチャなど、大規模な情報システムを組み上げられるような素子とシステムの構成に成功したと発表した。

[13:07 8/11]

HPCからモバイルまで、プロセサの最新技術が一気に発表 - Hot Chips 26

8月10日からHot Chips 26が開幕した。会場は、Cupertino市にあるDe Anza CollageのFlint Centerという劇場である。初日の8月10日はチュートリアルで、午前はセキュリティ関係、午後はIoT関係のチュートリアルが行われる。

[10:23 8/11]

2014年08月08日(金)

コンピュータアーキテクチャの話 第310回 超マルチスレッドプロセサである「GPU」に見るグラフィックス処理

3Dグラフィックスを高速で処理するGPUは、実は、超マルチスレッドプロセサである。ということで、グラフィックス処理とGPUについてみて行こう。

[10:00 8/8]

2014年08月01日(金)

AMD、64ビットARMプロセッサ搭載Opteron開発を用いた開発キットを発表

AMDは、64ビットARMベース・プロセッサ(コードネーム:Seattle)を搭載した開発キット「AMD Opteron A1100 Series 64-bit ARM Developers kit」の提供を開始したと発表した。

[09:00 8/1]

2014年07月25日(金)

ToMMO、被災地住民を含む約15万人のゲノム解析を行うスパコンを運用開始

東北大学東北メディカル・メガバンク機構(ToMMo)は7月23日、東日本大震災の被災地を含む宮城県および岩手県の住民約15万人から提供されるゲノムの解析などを行うスーパーコンピュータシステム「大規模ゲノムコホート解析システム」を7月から本格的に運用開始したと発表した。

[10:00 7/25]

2014年07月23日(水)

産総研、クラウド間の垣根を超える仮想クラスタ型計算機構築技術を開発

産業技術総合研究所(産総研)は7月18日、高性能計算を実行する環境を一度つくれば、異なるクラウド上でも簡単に仮想クラスタ型計算機を構築でき、すぐに使える技術を開発したと発表した。

[09:00 7/23]

2014年07月22日(火)

GTC Japan 2014 - GPUの仮想化を推進するNVIDIA

GTC Japan 2014において、同社のGRID関係のシニアソリューションアーキテクトのJeremy Main氏が、GPUの仮想化に関する一連の説明セッションを行った。

[11:00 7/22]

GTC Japan 2014 - Tegra K1でGraph500

GTC Japan 2014において、九州大学の藤澤克樹 教授が「Tegra K1プロセッサ上での高速かつ省電力なグラフ探索ソフトウェアの開発」と題する発表を行った。

[10:00 7/22]

2014年07月18日(金)

幅広い分野での活用が進むGPU - GTC Japan 2014基調講演

7月16日、東京ミッドタウンで「GTC(GPU Technology Conference)」が開催された。今年の参加者は1700人を超え、昨年を200人あまり上回る盛況である。今年のGTCでは、NVIDIAフェローのDavid Kirk氏が基調講演を行った。Kirk氏は1997年から2009年まで同社の主席研究員を務め、現在のGPUの興隆をもたらしたグラフィック技術の開発を主導した人である。現在は特別研究員という肩書で、自分の興味のある研究を行っているという。

[12:29 7/18]

コンピュータアーキテクチャの話 第309回 SPARC Tシリーズに受け継がれるSunのNiagaraプロセサの思想

Sun Microsystems(現在はOracleの一部となっている)は、2004年にNiagara(正式名称はUltraSPARC T1)と呼ぶプロセサをHot Chips 16で発表した。Niagaraは、4スレッドをサイクルごとに切り替えて実行するマルチスレッドプロセサコアを、1チップに8個搭載し、チップ全体では32スレッドを並列に実行できるプロセサであった。

[10:00 7/18]

2014年07月17日(木)

さあ、すごい未来を世界に見せよう! - NVIDIA、GTC Japan 2014を開催

NVIDIAは7月16日、都内で同社GPUに関するカンファレンス「GPU Technology Conference Japan 2014(GTC Japan 2014)」を開催した。基調講演には、同社FellowのDavid Kirk氏が、GPUに関する最新トピックスならびにGPUを活用して切り開かれる未来の姿の説明を行った。

[00:00 7/17]

2014年07月15日(火)

富士通研、クラスタ型スパコンのネットワークスイッチを4割削減

富士通研究所は7月15日、数千台規模のPCクラスタ型スパコンシステムのネットワークを構成するスイッチの台数を、ネットワーク性能を維持したまま約4割削減する技術を開発したと発表した。

[17:00 7/15]

2014年07月04日(金)

コンピュータアーキテクチャの話 第308回 Intel CoreやXeonも採用しているSMT方式

演算レーテンシや1次キャッシュヒットのメモリアクセスのような数サイクルの空きサイクルを無駄にしない方法として、「同時マルチスレッディング(SMT)」という方式がある。スレッドごとにプログラムカウンタやレジスタのセットを持つのはVMTと同じであるが、SMTの場合は、命令ごとにどのスレッドの命令であるかという情報を持ち、この情報で使用するレジスタセットを選択する。

[10:00 7/4]

2014年07月02日(水)

東工大「TSUBAME-KFC」、2期連続で世界一の省エネスパコンを達成

東京工業大学(東工大)は7月1日、同大学術国際情報センター(GSIC)がNECやNVIDIAなどと協力して開発し、2013年10月より稼動を開始したスーパーコンピュータ(スパコン)「TSUBAME-KFC」が、1Wあたり4389.82MFlopsという値で、2014年6月版のスパコンの省エネランキング「The Green500 List」で1位を獲得したと発表した。

[09:00 7/2]

2014年07月01日(火)

東北大とNEC、次世代スーパーコンピュータ技術の共同研究部門を開設

東北大学とNECは6月27日、同大 サイバーサイエンスセンター内に「高性能計算技術開発(NEC)共同研究部門」を設置し、次世代スーパーコンピュータの技術研究を7月1日より開始すると発表した。

[10:52 7/1]

新たな「もつれ状態」を発見-NII、巨視的物体をテレポートさせる方法を開発

国立情報学研究所(NII)とロシア科学アカデミーは6月30日、可視可能な大きさの(巨視的)物体をテレポートさせる新たな方法を開発したと発表した。

[09:00 7/1]

2014年06月27日(金)

東工大など、1W当たり30GFlopsを達成したスパコン向けプロセッサを開発

東京工業大学(東工大)と一橋大学、会津大学、台湾Alchip Technologiesは6月27日、世界最高水準となる30GFlops/Wの性能を有するスーパーコンピュータ向けプロセッサチップ「PACS-G」を開発したと発表した。

[14:08 6/27]

2014年06月26日(木)

Micron/Intel、次世代プロセッサ向けオンパッケージメモリ技術を共同開発

Micron TechnologyとIntelは6月24日(現地時間)、コードネーム「Knights Landing」と名づけられたIntelの次世代Xeon Phiプロセッサ向けオンパッケージメモリソリューションを共同開発していると発表した。

[17:34 6/26]

日本のスパコン「京」 -グラフ解析の性能ランキング「Graph500」で1位を獲得

理化学研究所(理研)、東京工業大学(東工大)、アイルランドのユニバーシティ・カレッジ・ダブリンは6月24日、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキング「Graph500」において、理研のスパコン「京」が第1位を獲得したと発表した。

[16:53 6/26]

次世代Xeon Phiの活用で前世代比最大3倍のパフォーマンスを実現 - Intel

Intelは、Silvermontアーキテクチャーベースの次世代「Intel Xeon Phi(開発コード名:Knights Landing)」に関するアップデートを行った。

[16:34 6/26]

2014年06月24日(火)

スパコン性能ランキング「TOP500」 - 中国が3回連続1位を達成

独ライプツィヒで開催されている「International Supercomputing Conference(2014 国際スーパーコンピュータ会議)」において6月23日(独時間)、スーパーコンピュータ(スパコン)処理能力ランキング「TOP500」の2014年6月版が発表された。

[13:58 6/24]

AlteraとMicrosoft、FPGAにより検索エンジンの高速化を実現

Alteraは6月16日(現地時間)、自社のFPGAがソフトウェア定義データセンター(SSDC)の開発において中心的な役割を果たし、Microsoft ResearchならびにBingと協力して、ウェブ検索エンジンの一部を高速化させたと発表した。

[08:57 6/24]

2014年06月20日(金)

コンピュータアーキテクチャの話 第307回 VMTによりハードウェア効率を向上させたIBMのPOWER3

汎用的なプロセサでマルチスレッドが使われたのは、IBMの「POWER3」プロセサではないかと思われる。メモリアクセスがキャッシュをミスしてメインメモリをアクセスするとデータがプロセサに届くまでに長い時間が掛り、その間、プロセサコアは遊んでしまうため、効率を向上させるために実行するプログラムを切り替える「垂直(Vertical Multi-Threading:VMT)」方式が採用された。

[10:00 6/20]

2014年06月13日(金)

富士通研、CPU間通信としては世界最高速となる56Gbps受信回路を開発

富士通研究所は6月13日、次世代サーバに搭載されるCPUなどのチップ間データ通信において、56Gbpsの高速データを受信できる回路を開発したと発表した。

[20:59 6/13]

テックウインド、Tesla対応GPUコンピューティングサーバ2機種を発表

テックウインドは6月13日、NVIDIA Tesla K40Mを搭載可能なGPUコンピューティングサーバとして、「4GPU搭載2Uハイエンドプロモデル」および「3GPU搭載1Uコンパクトプロモデル」の2機種を発表した。

[15:14 6/13]

2014年06月12日(木)

サッカー経験はないけど、本田選手の「無回転シュート」を蹴ってみたい。

僕が注目するのはやっぱり日本のエース・本田圭佑である。2010年の南アフリカ大会で本田が見せた「無回転シュート」は今でも語り草だ。ゴール手前の不規則な変化は、テレビで見ていてもはっきりわかるほどすごかった。それでふと思ったのだけど、あの無回転シュートって、原理はどうなっているのだろうか。

[10:00 6/12]

2014年06月06日(金)

コンピュータアーキテクチャの話 第306回 メインプロセサが多スレッドをサイクルごとに切り替えて実行するHEPスパコン

1982年に作られたDenelcorの「HEP(Heterogeneous Element Processor)」スパコンでは、メインの計算プロセサが8~50個のスレッドをサイクルごとに切り替えて実行するという方式が取られた。

[10:30 6/6]

2014年05月29日(木)

NEC、次世代ベクトル型スパコン「SX-ACE」を東北大学や大阪大学から受注

NECは5月29日、同社の次世代ベクトル型スーパーコンピュータ(スパコン)「SX-ACE」を東北大学サイバーサイエンスセンターおよび大阪大学サイバーメディアセンターからそれぞれ受注したこと、ならびに国立環境研究所が「SX-9」の後継機として「SX-ACE」の導入を決定したことを発表した。

[15:08 5/29]

2014年05月23日(金)

コンピュータアーキテクチャの話 第305回 複数の命令列を並列実行するマルチスレッドプロセサ

マルチスレッドプロセサは、複数の命令列(スレッド)を並列的に実行するプロセサである。その点では、それぞれが1つの命令列を実行するマルチコアプロセサもマルチスレッドプロセサである。

[10:00 5/23]

2014年05月22日(木)

東大など、不確定性原理に基づかない盗み見が困難な新量子暗号方式を考案

東京大学(東大)は5月22日、従来の不確定原理に基づく量子暗号方式とはまったく異なる動作原理に基づく量子暗号方式を考案し、従来は必要とされていた通信路の雑音量を監視せずにセキュリティを確保できることを証明したと発表した。

[09:00 5/22]

2014年05月20日(火)

Cool Chips XVII - AlteraのFPGAでOpenCLアクセラレータを作る

横浜で開催された「Cool Chips XVII」で、AlteraのDirk Seynhaeve氏がFPGAを使ったOpenCLで動かす並列処理プロセサについてのチュートリアルを行った。

[10:00 5/20]

2014年05月19日(月)

Cool Chips XVII-カスタムハード設計を効率化するXilinxのVivado高レベル合成

横浜で開催された「Cool Chips XVII」で、 XilinxのIgor Kostarnov氏がFPGAの高レベル合成ついてのチュートリアルを行った。

[10:00 5/19]

2014年05月15日(木)

Cool Chips XVII - 特定用途向けの高性能プロセサ、SynopsysのASIP

横浜で開催された「Cool Chips XVII」では、Synopsysの井出野雅明氏が同社のApplication Specific Processor(ASIP)の設計法についてのチュートリアルを行った。

[10:30 5/15]

IMS、イオントラップで量子回転子を作りトンネル効果中の量子位相を観測

分子科学研究所(IMS)と大阪大学は、イオントラップ中に極低温状態の3個のカルシウムイオンを三角形に配列させて、ミクロンサイズの量子回転子を作り、これを使ってトンネル粒子によるアハラノフボーム効果を実証することに成功したと発表した。

[09:30 5/15]

2014年05月14日(水)

簡単GPUプログラミング - OpenACC上級編 第6回 CUDAプログラムからOpenACCプログラムを呼び出す方法

#pragma acc parallel loopディレクティブにdeviceptr節を付ける例ではx、yはcudaMallocでGPUメモリ上に確保されている。そして、deviceptrは、xとyは既にデバイスメモリのアドレスなので、コンパイラとしては何も加工する必要はなく、GPUメモリ上のポインタとしてカーネル化したループに渡せば良いことを示している。

[10:00 5/14]

2014年05月12日(月)

Cool Chips XVII - D-Waveの量子コンピュータの最新状況(後編)

4月14日から17日にかけて開催された「Cool Chips XVII」においてD-Wave SystemsのColin Williams氏が同社の量子コンピュータの最新状況を中心に基調講演を行った。

[11:00 5/12]

NVIDIA、コンパイラ&ツールスイート「PGI 2014」の最新版の提供を開始

NVIDIAは5月6日、コンパイラ&ツールスイート「PGI 2014」のバージョン14.4の提供を開始したと発表した。

[10:39 5/12]

簡単GPUプログラミング - OpenACC上級編 第5回 OpenACCが備える大きなメリットとは?

OpenACCは、ディレクティブの追加で比較的簡単にGPUプログラムを作ることができるだけでなく、CUDAやOpenCLと一緒に使うこともできる。すでにCUDAで書かれたプログラムがあり、新たに機能を付け加える場合、追加部分だけOpenACCで書くという使い方や、その逆にOpenACCのプログラムにCUDAで書いたコードを加えることもでき、最適化されたCUDAライブラリを使うこともできる。OpenACCを使う場合、全部をOpenACCで書き直す必要はない。これはOpenACCの大きなメリットである。

[10:00 5/12]

2014年05月09日(金)

Cool Chips XVII - D-Waveの量子コンピュータの最新状況(中編)

4月14日から17日にかけて開催された「Cool Chips XVII」においてD-Wave SystemsのColin Williams氏が同社の量子コンピュータの最新状況を中心に基調講演を行った。

[11:00 5/9]

簡単GPUプログラミング - OpenACC上級編 第4回 実質的な転送時間ゼロを実現する手法

データリージョンとupdate指定などをうまく使うことによって、無駄な転送を省き、プログラムの性能を上げることができるが、必要なデータ転送だけは残ってしまう。しかし、このデータ転送をGPU処理と並列に実行することができれば、転送時間はGPU処理に隠れて、実質的に転送時間ゼロとすることも可能となる。

[10:00 5/9]

コンピュータアーキテクチャの話 第304回 電力の削減と高性能の両立を狙ったARMのbig.LITTLE

2011年9月にARMは「big.LITTLE」という方式を発表した。big.LITTLEは、性能の高い大きなコアと性能は低いが電力効率の高い小さなコアをペアとして使用し、Tegra 3のコンパニオンコアと同様な効果を得るというものである。

[10:00 5/9]

2014年05月08日(木)

Cool Chips XVII - D-Waveの量子コンピュータの最新状況(前編)

4月14日から17日にかけて開催された「Cool Chips XVII」においてD-Wave SystemsのColin Williams氏が同社の量子コンピュータの最新状況を中心に基調講演を行った。

[11:00 5/8]

2014年05月07日(水)

簡単GPUプログラミング - OpenACC上級編 第3回 OpenACC 2.0でサポートされたACC_MAP_DATA

OpenACC 2.0ではACC_MAP_DATAという機能がサポートされた。図7では、cudaMallocでx_dという領域をデバイスメモリ上に確保し、それをacc_map_dataでOpenACCのxという配列にマップしている。y_dも同様にyという配列にマップしている。

[10:00 5/7]

2014年05月02日(金)

簡単GPUプログラミング - OpenACC上級編 第2回 階層と関係なくデータリージョンの開始の指定と終了の指定を個別に書き出す

普通のデータリージョンは#pragma acc dataに続く{ }の中がその範囲となるが、このようなプログラム階層とは関係なくデータリージョンを作る機能がUnstructured Data Regionで、データリージョンの開始の指定と終了の指定を個別に書くことができる。

[10:00 5/2]

京大など、ブラックホールを記述する新理論をコンピュータで検証

京都大学と高エネルギー加速器研究機構(KEK)、茨城大学は、ブラックホールで起こる力学現象を厳密に記述できる新理論を、コンピュータによって数値的に検証したと発表した。

[09:00 5/2]

2014年05月01日(木)

GTC 2014 - OpenACCとMPIやOpenMPを組み合わせて複数GPUを使う(後編)

1つのGPUでは性能が足りない場合は複数のGPUを使うことになる。OpenACCを使うGPUプログラムを書き方は、OpenACCの入門編と上級編でカバーしてきたが、これだけでは複数のGPUを使うプログラムは作れない。GTC 2014において、NVIDIAのPGIコンパイラ部門のMichael Wolfe氏が複数GPUを使う方法を説明した。

[10:00 5/1]

2014年04月30日(水)

GTC 2014 - OpenACCとMPIやOpenMPを組み合わせて複数GPUを使う(前編)

1つのGPUでは性能が足りない場合は複数のGPUを使うことになる。OpenACCを使うGPUプログラムを書き方は、OpenACCの入門編と上級編でカバーしてきたが、これだけでは複数のGPUを使うプログラムは作れない。GTC 2014において、NVIDIAのPGIコンパイラ部門のMichael Wolfe氏が複数GPUを使う方法を説明した。

[14:17 4/30]

簡単GPUプログラミング - OpenACC上級編 第1回 色々な機能があるデータリージョン

GTC 2014において、NVIDIAのJeff Larkin氏は、OpenACC入門に引き続いて、「Advanced Accelerated Computing using Compiler Directives」と題してOpenACCの上級編のチュートリアルを行ったので、入門編に引き続き紹介したい。

[13:00 4/30]

2014年04月25日(金)

簡単GPUプログラミング - OpenACC入門 第5回 フリーのOpenACCコンパイラの開発も進行中

GTC 2014において、NVIDIAのJeff Larkin氏がOpenACCのチュートリアルを行った。OpenACCを理解するうえで、分かりやすいと思うので、紹介したい。

[10:00 4/25]

2014年04月23日(水)

簡単GPUプログラミング - OpenACC入門 第4回 詳細な指定が可能なloopディレクティブ

GTC 2014において、NVIDIAのJeff Larkin氏がOpenACCのチュートリアルを行った。OpenACCを理解するうえで、分かりやすいと思うので、紹介したい。

[10:00 4/23]

2014年04月21日(月)

GTC 2014 - オープンソースのOpenACCコンパイラの状況

現状では、OpenACCを使うためには、Cray、CAPS、あるいはPGI(現在はNVIDIAの一部)のコンパイラを買う必要がある。なお、CAPSとPGIのコンパイラは無料のトライアルライセンスがあり、試してから買うということができる。しかし、OpenACCの人気の高まりから、オープンソースの無料で使えるコンパイラの開発が始まっている。GTC 2014で発表のあった、gccでのOpenACCのサポートとヒューストン大学のOpenUHでのOpenACCサポートを紹介する。

[11:41 4/21]

簡単GPUプログラミング - OpenACC入門 第3回 OpenACCで性能を発揮するためのコツ

GTC 2014において、NVIDIAのJeff Larkin氏がOpenACCのチュートリアルを行った。OpenACCを理解するうえで、分かりやすいと思うので、紹介したい。

[10:00 4/21]

2014年04月18日(金)

GTC 2014 - 筑波大の密結合アクセラレータ「TCA」(後編)

筑波大学計算科学研究センターの「HA-PACS/TCA」は、2013年11月のGreen500で3位となったスパコンシステムである。10コアの「Xeon E5-2680v2」2ソケットに4基の「NVIDIA K20x」GPUを接続した計算ノードを使っているが、16ノードを独自開発の「PEACH2」というデバイスを使って密結合したアクセラレータ(Tightly Coupled Accelerators)となっていることが特徴である。

[10:00 4/18]

簡単GPUプログラミング - OpenACC入門 第2回 OpenACCを活用するうえで重要な4つのステップ

GTC 2014において、NVIDIAのJeff Larkin氏がOpenACCのチュートリアルを行った。OpenACCを理解するうえで、分かりやすいと思うので、紹介したい。

[10:00 4/18]

2014年04月17日(木)

GTC 2014 - 筑波大の密結合アクセラレータ「TCA」(前編)

筑波大学計算科学研究センターの「HA-PACS/TCA」は、2013年11月のGreen500で3位となったスパコンシステムである。10コアの「Xeon E5-2680v2」2ソケットに4基の「NVIDIA K20x」GPUを接続した計算ノードを使っているが、16ノードを独自開発の「PEACH2」というデバイスを使って密結合したアクセラレータ(Tightly Coupled Accelerators)となっていることが特徴である。

[10:00 4/17]

2014年04月16日(水)

簡単GPUプログラミング - OpenACC入門 第1回 手軽にGPUを利用した高速計算が可能となるOpenACC

GTC 2014において、NVIDIAのJeff Larkin氏がOpenACCのチュートリアルを行った。OpenACCを理解するうえで、分かりやすいと思うので、紹介したい。

[10:30 4/16]

GTC 2014 - GPUの浮動小数点演算の精度:理論と実践(後編)

GTC 2014において、Lars Nyland、Dale Southard、Alex Fit-Floreaという3人の NVIDIAの技術者が、浮動小数点演算に関する誤解を解き、精度の高い計算を行うための手法を説明するという発表を行った。

[10:00 4/16]

2014年04月15日(火)

GTC 2014 - GPUの浮動小数点演算の精度:理論と実践(中編)

GTC 2014において、Lars Nyland、Dale Southard、Alex Fit-Floreaという3人の NVIDIAの技術者が、浮動小数点演算に関する誤解を解き、精度の高い計算を行うための手法を説明するという発表を行った。

[10:30 4/15]

2014年04月14日(月)

GTC 2014 - GPUの浮動小数点演算の精度:理論と実践(前編)

GTC 2014において、Lars Nyland、Dale Southard、Alex Fit-Floreaという3人の NVIDIAの技術者が、浮動小数点演算に関する誤解を解き、精度の高い計算を行うための手法を説明するという発表を行った。

[10:00 4/14]

2014年04月11日(金)

コンピュータアーキテクチャの話 第303回 マルチコア以下の状況にあるメニーコアプロセサの電源制御

メニーコアプロセサの電源制御のレベルは、マルチコア以下という状況である。これは、これらのメニーコアプロセサは全コアがほぼ同様に動くような使い方を想定しているので、電力制御としては全体をまとめてシングルコアのように考えているからではないかと思われる。また、現在のメニーコアチップは集積するコア数を増やすのが第一で電源制御にチップ面積を割く余裕がない、というのもその理由ではないかと思われる。

[10:00 4/11]

2014年04月10日(木)

GTC 2014 - Fire and Ice:温度はGPU性能にどう影響するか(後編)

GTC 2014で、Harvard-Smithsonian Center for AstrophysicsのDanny Price 氏が「Fire and Ice: How temperature affects GPU performance」と題する発表を行った。

[10:00 4/10]

2014年04月09日(水)

日立、海外から日本の技術計算環境を自在に使える基本技術を開発

日立製作所は4月9日、海外の設計、開発、研究拠点から、日本に設置されたスーパーコンピュータなどの技術計算環境を日本国内の拠点と同様に利用できる基本技術を開発したと発表した。

[18:01 4/9]

NTTなど、長寿命の隠れた量子状態である"ダーク状態"のメカニズムを解明

NTTと国立情報学研究所(NII)、大阪大学は4月8日、超伝導磁束量子ビットとダイヤモンド量子メモリを組み合わせたハイブリッド系において、長い寿命を持つ隠れた量子状態である"ダーク状態"が発現するメカニズムを明らかにしたと発表した。

[16:12 4/9]

GTC 2014 - Fire and Ice:温度はGPU性能にどう影響するか(前編)

GTC 2014で、Harvard-Smithsonian Center for AstrophysicsのDanny Price 氏が「Fire and Ice: How temperature affects GPU performance」と題する発表を行った。

[10:00 4/9]

2014年04月08日(火)

GTC 2014 - GPUの電力を正確に測定するには

NVIDIAのハイエンドGPU「Tesla K20/K40」は消費電力のセンサを持っており、NVIDIAのManagementライブラリを使うとこのセンサの値を読むことができる。ということで、GPUの消費電力を測ってみたのであるが、どうも結果がおかしいということで、テキサス州立大のMartin Burtscher准教授は、正確な消費電力を求めるには、どうすればよいかを研究したという結果をGTC 2014で発表した。

[10:30 4/8]

2014年04月03日(木)

GTC 2014 - NVIDIAの次世代GPU Pascal

NVIDIAはGTC 2014で、次世代GPUとして、2016年に「Pascal」を出すというロードマップを発表した。

[10:00 4/3]

2014年04月02日(水)

Cool Chips XVII - 4月14日より横浜にて開催

4月14日から17日にかけて、横浜情報文化センターで恒例の「Cool Chips」が開催される。Hot Chipsの姉妹学会であるCool Chipsは今回で17回と歴史を重ねてきている。

[09:30 4/2]

GTC 2014 - 基調講演でロードマップや新製品を発表

3月24日から27日にかけて米San JoseのMcEneryコンベンションセンターで開催された「GPU Technology Conference(GTC2014)」の基調講演で、NVIDIAのJen-Hsun Huang CEOが同社のGPUのロードマップや新製品などを発表した。

[09:00 4/2]

2014年03月29日(土)

理研、エクサスケール・スパコンの実現に向けたプロジェクトを4月より開始

理化学研究所(理研)は3月28日、2014年4月1日より、エクサスケールの演算性能を実現できる次世代スーパーコンピュータ(ポスト「京」)、およびその性能を最大限に引き出せるアプリケーションソフトウェアの開発を開始すると発表した。

[16:00 3/29]

2014年03月28日(金)

コンピュータアーキテクチャの話 第302回 最新CPUで採用 - 同じパッケージに搭載される安定化電源技術

IntelやIBMは、CPUチップ上、あるいはCPUと同じパッケージに搭載する安定化電源の研究を行ってきており、2014年2月のISSCCで、IntelはDesktop向けのHaswellプロセサ、IBMはPOWER8プロセサで、オンチップの安定化電源を搭載し、コアごとに、負荷状態に応じて最適な電源電圧を供給する構造を採っていることが発表された。

[11:00 3/28]

2014年03月27日(木)

NVIDIA、エクサスパコンの実現に向けたGPUインタコネクト「NVLink」を発表

NVIDIAは3月25日(米国時間)、「GTC 2014」にてエクサスケール・スーパーコンピュータの実現に向けた取り組みとして、今後のGPUにIBMと共同で開発した高速インタコネクト技術「NVIDIA NVLink」を統合することで、GPUとCPUのデータ共有速度を従来の5~12倍に向上させる計画を発表した。

[16:56 3/27]

2014年03月26日(水)

理研、理論演算性能90.8TFLOPSの新スパコンを導入 -富士通の「FX10」を採用

富士通は3月26日、理化学研究所(理研)放射光科学総合研究センターの新スーパーコンピュータシステムの構築を完了したと発表した。4月からの稼働が予定されている。

[12:57 3/26]

2014年03月25日(火)

NVIDIA GTC 2014が開幕 - GPUに関心を持つ人は増加傾向

2014年3月24日から27日にかけて、シリコンバレー首都を自称するSan Jose市のMcEneryコンベンションセンターでNVIDIAの「GPU Technology Conference(GTC 2014)」が開催される。GPUメーカーが主催するカンファレンスであるが、今年の参加者数は3500人を超え、500件の発表が行われる。昨年は2500人、400件であったので、GPUに関心を持つ人の数の増加が続いている。

[10:10 3/25]

2014年03月20日(木)

IBMとNYGC、Watsonを活用したがん患者向け個別ケアプロジェクトを開始

The New York Genome Center(NYGC)とIBMは3月19日(米国時間)、IBMの「Watsonコグニティブ・システム」を活用することでゲノム医療を促進する取り組みを開始することを発表した。

[15:52 3/20]

ISITと富士通、次世代スパコン向けプログラム高速化分析技術を開発

九州先端科学技術研究所(ISIT)と富士通、富士通研究所は3月20日、次世代のエクサスケールスーパーコンピュータに向けたユーザープログラムの高速化に関して、ビッグデータ解析による自動高速化手法を確立し、従来の人手による手法に比べて、実行速度を平均65%以上、高速化する技術を開発したと発表した。

[15:27 3/20]

SCSK、並列計算用PCクラスタシステムを日本自動車研究所へ提供

SCSKは3月20日、日本自動車研究所(JARI)に自動車衝突シミュレーションに活用する科学技術計算用システムとして、日本ヒューレット・パッカード製サーバを高速ネットワークで接続した「並列計算用PCクラスタシステム」を納入し、本格稼働がはじまったことを発表した。

[14:11 3/20]

2014年03月19日(水)

100万ビット規模の量子コンピュータの実現に向けた"もつれ"生成手法 - NTT

NTTは3月17日、光格子中に束縛された約100万個の原子に対して量子コンピュータのリソースとなる大規模な量子もつれ状態を高精度かつ高速に生成する手法を確立したと発表した。

[09:00 3/19]

2014年03月12日(水)

インテル、つくば本社に「インテル コラボレーション・センター」を開設

インテルは3月12日、将来のコンピューティングの利用モデルやコンセプトの積極的な発信を目指す施設「インテル コラボレーション・センター」を、同社のつくば本社内に開設したことを発表した。

[13:04 3/12]

NIMS、反強磁性体の磁気冷凍性能を最大にする方法を発見

物質・材料研究機構(NIMS)は3月10日、反強磁性体の磁気冷凍性能を最大限引き出す方法をコンピュータシミュレーションにより発見したと発表した。

[09:30 3/12]

2014年03月11日(火)

Maxim、データセンター向け11.3Gbpsイーサネット光トランシーバICを発表

Maxim Integratedは、データセンターの光モジュール向けに高集積10GBASE-LR SFP+光トランシーバIC「MAX3956」を発表した。

[11:07 3/11]

NEL、100Gクライアントインタフェース用小型高感度APD型ROSAを開発

NTTエレクトロニクス(NEL)は3月10日、100Gbpsクライアントインタフェース用の次世代小型プラガブル光トランシーバの構成部品として、「CFP2-MSA」および「CFP4-MSA」トランシーバに搭載可能な25G×4チャンネル集積アバランシェ型小型受信サブモジュール(APD型ROSA)を開発したと発表した。

[10:52 3/11]

2014年03月07日(金)

岡山大、「京」を使ってメタンハイドレートからメタンが分離する機構を解明

岡山大学は3月6日、理化学研究所(理研)のスーパーコンピュータ「京」を用いて、メタンハイドレートが分解し、メタンが分離するメカニズムを解明することに成功したと発表した。

[12:50 3/7]

光インターコネクション用レーザによる500m伝送の実証実験に成功 -古河電工

古河電気工業(古河電工)は3月6日、データセンタなどで用いられる光インターコネクション向けに、発光層にInGaAs歪量子井戸構造を採用し、25Gbps動作を実現した面発光レーザ(VCSEL)を開発し、Corningおよび古河電工子会社のOFSにて開発されたマルチモードファイバ、分散補償ファイバを用いて、最大500mの長距離伝送の実証実験に成功したと発表した。

[10:16 3/7]

コンピュータアーキテクチャの話 第301回 動的に電圧と周波数の制御を行った初の商用プロセサ - TransmetaのCrusoe

CMOSプロセサはSRAMの動作限界までは電源電圧を下げても論理的には正しく動作するが、動作できる最高クロック周波数はほぼ電源電圧に比例して低下していく。CMOSプロセサのダイナミック電力はαCV2fで表されるので、この関係を利用して、処理する仕事が多く、負荷が重い場合には電源電圧を上げてクロックを上げ、逆に負荷が低い状態では電源電圧とクロックを下げるという制御を行う方式を「DVFS」と呼ぶ。

[10:00 3/7]

2014年03月04日(火)

JAMSTEC、地球シミュレータと連携する大規模共有メモリ型システムを導入

日本SGIは、海洋研究開発機構(JAMSTEC)が、JAMSTECのスーパーコンピュータ「地球シミュレータ」と連携して計算処理の精度を高める新たな「プリポスト・システム」として大規模共有メモリサーバ「SGI UV 2000」製品群を採用したことを発表した。

[15:02 3/4]

2014年03月03日(月)

T2K-Tsukubaを用いて高校生が5×5魔法陣の解を求めることに成功 - 筑波大

筑波大学は2月28日、同大学の計算科学研究センターが全国共同利用施設として一般公募により行っている「学際共同利用プログラム」において、平成25年度に採択された茨城県の高校生の「5×5の魔方陣のすべての解を求める」計算において、スーパーコンピュータ「T2K-Tsukuba」を使った並列計算により解を求めることに成功したと発表した。

[18:18 3/3]

2014年02月21日(金)

コンピュータアーキテクチャの話 第300回 将来のメニーコアに向けたアーキテクチャとその課題

2次元メッシュはコア数の増大に対してネットワーク直径の増加がコア数の平方根に比例し、リングと比較して緩やかであり、縦横のメッシュリンクの本数はコア数の平方根に比例して増える。しかし、2分バンド幅を一定に保とうとすれば、各リンクのビット幅か転送速度をコア数の平方根に比例して増やす必要がある。

[10:00 2/21]

2014年02月19日(水)

理研など、大規模シミュレーションで細胞内分子間情報伝達効率の詳細を解明

理化学研究所は2月18日、オランダ原子分子国立研究所との共同研究により、スーパーコンピュータによる大規模シミュレーションにより、細胞内分子間の情報伝達効率の上限を定義する基本理論を巡る論争に終止符を打ったと発表した。

[17:12 2/19]

2014年02月18日(火)

スパコン最大の学会「SC13」に見る先端技術 第25回 SC13 - 展示会場で見た最新技術(研究機関編)

SCには多数の米国の政府機関の研究所が出展しているのだが、2012年に他の政府機関が豪遊カンファレンスで高額な予算を使っていたというスキャンダルがあった関係で多くが出展を取りやめた米国の国立研究所だが、2013年は17の研究所が合同ブースという形で出展を行っていた。また併せて、日本の大学などのブースの様子もお伝えしたい。

[10:00 2/18]

2014年02月17日(月)

信州大、造水・水循環システムの開発拠点に富士通のスパコンシステムを導入

信州大学は2月13日、新たに構築する造水・水循環システムの研究開発拠点に富士通のスーパーコンピュータシステムを導入すると発表した。

[10:11 2/17]

富士通、京都教育大学のシステム基盤を刷新 - スマホなどでアクセス可能に

富士通は2月13日、京都教育大学と共同で、同大の教育・研究システム、図書館システム、および全学情報ネットワークの設備を刷新し、本格運用を開始したと発表した。

[09:52 2/17]

2014年02月14日(金)

スパコン最大の学会「SC13」に見る先端技術 第24回 SC13 - 展示会場で見た最新技術(HPCコンポーネント編)

SC13の展示で一番興味深かったのはMicronの展示である。高メモリバンド幅のHMCは、富士通の次期スパコンプロトタイプをはじめとして5種のボードが展示され、業界の期待の高さを示したし、Automataも技術的に面白かった。今回はそういったコンポーネントを展示していたメーカーを紹介したい。

[10:00 2/14]

2014年02月12日(水)

スパコン最大の学会「SC13」に見る先端技術 第23回 SC13 - 展示会場で見た最新技術(企業編)

今回のSC13では、Colorado Convention Centerの2階のフロアが展示会場にあてられ、企業、大学、研究所など、あわせて350のブースが設けられた。今回は、スパコンの新製品の端境期で、新スパコンの発表は少なかったが、それでも、興味深い展示が多く見られた。

[10:00 2/12]

2014年02月07日(金)

コンピュータアーキテクチャの話 第299回 MITのマルチプロセサ研究の成果を活用 - Tilera

MITで長らくマルチプロセサを研究してきたAnant Agarwal教授が、その研究の商用化を目指して作ったのがTileraという会社である。その名のように、タイルのようにプロセサコアを敷き詰めるメニーコアのプロセサを商用化している。

[10:00 2/7]

2014年02月06日(木)

スパコン最大の学会「SC13」に見る先端技術 第22回 SC13 - Micronの超高速サーチエンジン「Automata」

SC13においてMicronは、「Automata」と呼ぶサーチや解析を超高速で実行する非ノイマン型のプロセサを発表した。

[10:00 2/6]

2014年02月04日(火)

スパコン最大の学会「SC13」に見る先端技術 第21回 SC13 - Micronの超高バンド幅メモリHybrid Memory Cube(後編)

CPUチップの性能が上がれば、それに比例して多くのデータをメモリから読み、処理結果をメモリに書き込む必要があるが、DRAMチップのメモリバンド幅の増加は、CPUの性能向上に追いついていない。そこで高バンド幅で、多数チップを接続してメモリ容量を拡大でき、さらにサーバでの使用に耐える信頼度を持つメモリとしてMicronはHybrid Memory Cube(HMC)を考案し、HMCコンソーシアムを作って開発を進めている。

[09:00 2/4]

2014年02月03日(月)

富士通研と古河電工、半分以下のコストで接続可能な多心光コネクタを開発

富士通研究所と古河電気工業は2月3日、サーバ機器内の高速データ伝送を実現する光インターコネクト向けに、多数の光ファイバを一括で接続する多心光コネクタを開発したと発表した。

[18:38 2/3]

2014年01月31日(金)

九大、総合理論演算性能720.6TFLOPSの新スパコンシステムを稼働

九州大学と日立製作所は1月31日、九州大学情報基盤研究開発センターが学内外の研究者向けにネットワークを介してスーパーコンピュータ(スパコン)を利用した計算サービスを提供する研究用計算機システム「高性能アプリケーションサーバシステム」の本格稼働を2013年12月27日より開始したことを明らかにした。

[12:12 1/31]

スパコン最大の学会「SC13」に見る先端技術 第20回 SC13 - Micronの超高バンド幅メモリHybrid Memory Cube(前編)

CPUチップの性能が上がれば、それに比例して多くのデータをメモリから読み、処理結果をメモリに書き込む必要があるが、DRAMチップのメモリバンド幅の増加は、CPUの性能向上に追いついていない。そこで高バンド幅で、多数チップを接続してメモリ容量を拡大でき、さらにサーバでの使用に耐える信頼度を持つメモリとしてMicronはHybrid Memory Cube(HMC)を考案し、HMCコンソーシアムを作って開発を進めている。

[10:30 1/31]

筑波大など、ダイヤモンドで量子コンピュータに必要な量子エラー訂正に成功

筑波大学は1月30日、ドイツの研究機関と共同で、室温での固体量子ビットの量子エラー訂正に成功したと発表した。

[09:51 1/31]

2014年01月30日(木)

東北大など、サメの歯が生体材料で最高硬度を持つ理由をスパコンで解明

東北大学 原子分子材料科学高等研究機構は1月29日、東京医科歯科大学との共同研究により、世界最先端の「超高分解能走査透過型電子顕微鏡」を駆使して、生体材料として最高硬度を持つサメの歯の最表面に存在するエナメル質=「フッ化アパタイト(Ca5(PO4)3F)」の原子構造を可視化することに成功し、さらにサメの歯の原子構造に基づいて、スーパーコンピュータを用いた計算を行い、エナメル質内部に入り込んだフッ素が強固な化学結合を形成することで、高い機械強度と優れた脱灰性を持った虫歯になり難い構造が自己形成されていることを発見したと発表した。

[10:04 1/30]

2014年01月28日(火)

スパコン最大の学会「SC13」に見る先端技術 第19回 SC13 - Top500 1位の天河2号の概要(後編)

SC13において、中国人民解放軍国防科学技術大学のYutong Lu教授が天河2号(Tianhe-2)スパコンについて招待講演を行った。天河2号はLINPACKの実行で33.8627PFlopsの記録を持つTop500 1位のスパコンである。

[10:00 1/28]

2014年01月24日(金)

東大宇宙線研、性能を従来システム比で10倍向上させた計算機システムを稼働

富士通は1月24日、東京大学(東大)宇宙線研究所のPCクラスタシステムを中核とした宇宙線研究向け計算機システムを構築し、2014年1月1日より稼働を開始したを明らかにした。

[14:53 1/24]

コンピュータアーキテクチャの話 第298回 Intelのメニーコアチップ - Xeon Phi

2012年11月に、IntelはメニーコアのXeon Phiプロセサを発表した。発表された「Xeon Phi 5110Pプロセサ」は60コアという仕様になっているが、チップ写真を見るとチップには62コアが搭載されており、その内の2コアの不良を許容して歩留りを上げるという仕様になっていると考えられる。

[10:00 1/24]

2014年01月23日(木)

スパコン最大の学会「SC13」に見る先端技術 第18回 SC13 - Top500 1位の天河2号の概要(前編)

SC13において、中国人民解放軍国防科学技術大学のYutong Lu教授が天河2号(Tianhe-2)スパコンについて招待講演を行った。天河2号はLINPACKの実行で33.8627PFlopsの記録を持つTop500 1位のスパコンである。

[10:00 1/23]

2014年01月21日(火)

GPUシミュレーションに製造業が高い関心 -NVIDIA、Manufacturing Day(後編)

1月17日にNVIDIAはManufacturing Dayというワークショップを開催した。400人程度入る会場は、ほぼ満席で、製造業のGPUに関する関心の高さがうかがえる。

[10:00 1/21]

スパコン最大の学会「SC13」に見る先端技術 第17回 SC13 - 新しいエネルギー効率指標Total-power Usage Effectiveness(後編)

データセンターのエネルギー効率の指標としてのPUEは2006年に提案されたものであるが、この7年ですっかり定着した。しかし、PUEは完全ではない。IT機器の筐体の中にファンがある場合は、そのファンの消費電力はIT機器の消費電力になるが、データセンターに設置されているファンの消費電力はオーバヘッドの消費電力になる。

[10:00 1/21]

2014年01月20日(月)

GPUシミュレーションに製造業が高い関心 -NVIDIA、Manufacturing Day(前編)

1月17日にNVIDIAはManufacturing Dayというワークショップを開催した。400人程度入る会場は、ほぼ満席で、製造業のGPUに関する関心の高さがうかがえる。

[13:00 1/20]

2014年01月17日(金)

コンピュータアーキテクチャの話 第297回 輸出ディレクトリを用いたキャッシュコヒーレンス

1996年に発売されたSilicon Graphicsの「Origin 2000サーバ」は、ディレクトリベースのコヒーレンス制御を使う最初の商用サーバで、シングルコアCPU 2ソケットからなる計算ノードを最大512ノードまで接続可能な設計となっていた。そして、データを格納するメインメモリに加えてディレクトリを格納するメモリを持っていた。

[10:00 1/17]

2014年01月16日(木)

スパコン最大の学会「SC13」に見る先端技術 第16回 SC13 - 新しいエネルギー効率指標Total-power Usage Effectiveness(前編)

データセンターのエネルギー効率の指標としてのPUEは2006年に提案されたものであるが、この7年ですっかり定着した。しかし、PUEは完全ではない。IT機器の筐体の中にファンがある場合は、そのファンの消費電力はIT機器の消費電力になるが、データセンターに設置されているファンの消費電力はオーバヘッドの消費電力になる。

[10:00 1/16]

2014年01月14日(火)

富士通研、従来比3倍の3000原子規模のナノデバイスシミュレーションに成功

富士通研究所は1月14日、スーパーコンピュータを利用して従来比3倍となる3000原子規模のナノデバイスにおける電気特性シミュレーションに成功したと発表した。

[14:49 1/14]

スパコン最大の学会「SC13」に見る先端技術 第15回 SC13 - ビッグデータ処理性能のランキング Graph500

ビッグデータの処理では色々な関連性を分析することが多い。このような関連性は、ノードをエッジで繋いだグラフで表すことができる。次の図のように、WWWのリンクやインタネットの通信網、ソーシャルネットワークのつながりから、細胞の中のたんぱく質の相互作用などもネットワークになっている。

[10:00 1/14]

2014年01月10日(金)

コンピュータアーキテクチャの話 第296回 メニーコアにおけるキャッシュコヒーレンス

マルチコアのキャッシュコヒーレンスの説明のところでは、スヌープを全部のコアに放送(ブロードキャスト)するというやり方を説明したが、このやり方では、コア数に比例して放送の回数が増加する。しかし、メニーコアチップの場合、コア数に比例してリングやメッシュネットワークのバンド幅を増やすことは難しい。

[10:00 1/10]

2014年01月09日(木)

スパコン最大の学会「SC13」に見る先端技術 第14回 SC13 - HPC Challenge Class 2で筑波大が初勝利

Top500はHPLだけでランキングを行っており、プロセサの演算器からキャッシュまでの性能の評価が中心となっている。これでは、あまりにも一面的な評価であるという反省から作られたのが「HPC Challenge(略称HPCC)」である。

[10:00 1/9]

2014年01月07日(火)

スパコン最大の学会「SC13」に見る先端技術 第13回 SC13 - Green500と電力測定の問題(後編)

Top500はHPL(High Performance LINPACK)というプログラムの実行性能(Flops値)でスパコンのランキングを行うものであるが、Green500は、HPLを実行しているときの消費電力でFlops値を割ったFlops/Wというエネルギー効率でスパコンのランキングを行う。ただし、Green500リストに入れてもらうには、あまり小さいコンピュータではダメで、Top500の500位のシステムと同等以上の性能を持つことが要件になっている。

[10:00 1/7]

2014年01月02日(木)

スパコン最大の学会「SC13」に見る先端技術 第12回 SC13 - Green500と電力測定の問題(中編)

Top500はHPL(High Performance LINPACK)というプログラムの実行性能(Flops値)でスパコンのランキングを行うものであるが、Green500は、HPLを実行しているときの消費電力でFlops値を割ったFlops/Wというエネルギー効率でスパコンのランキングを行う。ただし、Green500リストに入れてもらうには、あまり小さいコンピュータではダメで、Top500の500位のシステムと同等以上の性能を持つことが要件になっている。

[10:00 1/2]

バックナンバー

人気記事

一覧

イチオシ記事

新着記事