文献
J-GLOBAL ID:201702284025593125   整理番号:17A0243046

アプリケーション中の通信にPEACH3を利用した場合の評価

著者 (3件):
資料名:
巻: 116  号: 415(VLD2016 70-101)  ページ: 91-96  発行年: 2017年01月16日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,Graphic Processing Unit(GPU)の一般目的への利用(General Purpose computation using on GPUs,以下GPGPU)が普及し,ハイパフォーマンスコンピューティングの分野で複数のGPUを搭載したヘテロジーニアスクラスタが一般的になった。しかし,GPUを利用する際に必要な通信には大きな遅延を伴い,性能低下の原因となる。そこで,筑波大学計算科学研究センターは,複数のGPUを密に接続する事ができる密結合並列演算加速機構(Tightly Coupled Accelerators,TCA)を提案し,GPU同士の直接通信を可能とするTCAを利用したスイッチングハブ,PEACH2(PCI-Express Adaptive Communication Hub Ver.2)を開発した。しかしPEACH2は通信にPCIe Gen2x8を利用しており,バンド幅が充分とは言えなかった。そのためPCIe Gen3x8を利用できるPEACH3を新たに開発した。本報告では,このPEACH3を用いた幅優先探索(BFS)の実装を行い,PEACH3を導入する事による効果の評価をGraph500ベンチマークを利用し行った。1ノードあたり1台のGPUを利用し,最大2ノードでBFSを実行したところscale=18,edge factor=16の時531MTEPS(単位時間当たりに探索出来た辺の数)を達成した。これはPEACH2を利用した実装と比較すると最大で通信時間を91%に圧縮することが出来,TEPSは約1.13倍となった。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
専用演算制御装置  ,  プリント回路 
引用文献 (10件):
もっと見る
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る