アプリケーション中の通信にPEACH3を利用した場合の評価

金田隆大; 塙敏博; 天野英晴

文献

J-GLOBAL ID：201702284025593125 整理番号：17A0243046

アプリケーション中の通信にPEACH3を利用した場合の評価

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A0243046&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A0243046&from=J-GLOBAL&jstjournalNo=S0532B") }}

著者 (3件)： , ,
資料名：
巻： 116 号： 415(VLD2016 70-101) ページ： 91-96 発行年： 2017年01月16日
JST資料番号： S0532B ISSN： 0913-5685 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

近年,Graphic Processing Unit(GPU)の一般目的への利用(General Purpose computation using on GPUs,以下GPGPU)が普及し,ハイパフォーマンスコンピューティングの分野で複数のGPUを搭載したヘテロジーニアスクラスタが一般的になった。しかし,GPUを利用する際に必要な通信には大きな遅延を伴い,性能低下の原因となる。そこで,筑波大学計算科学研究センターは,複数のGPUを密に接続する事ができる密結合並列演算加速機構(Tightly Coupled Accelerators,TCA)を提案し,GPU同士の直接通信を可能とするTCAを利用したスイッチングハブ,PEACH2(PCI-Express Adaptive Communication Hub Ver.2)を開発した。しかしPEACH2は通信にPCIe Gen2x8を利用しており,バンド幅が充分とは言えなかった。そのためPCIe Gen3x8を利用できるPEACH3を新たに開発した。本報告では,このPEACH3を用いた幅優先探索(BFS)の実装を行い,PEACH3を導入する事による効果の評価をGraph500ベンチマークを利用し行った。1ノードあたり1台のGPUを利用し,最大2ノードでBFSを実行したところscale=18,edge factor=16の時531MTEPS(単位時間当たりに探索出来た辺の数)を達成した。これはPEACH2を利用した実装と比較すると最大で通信時間を91%に圧縮することが出来,TEPSは約1.13倍となった。(著者抄録)

, , , , , , , , , ,
, , , , , , ,

専用演算制御装置 , プリント回路

引用文献 (10件)：

T. Hanawa, Y. Kodama, T. Boku, and M. Sato, “Tightly coupled accelerators architecture for minimizing communciation latency among accelerators,” IEEE 27th IPDPSW, pp.1030-1039, 2013.
T. Hanawa, Y. Kodama, T. Boku, and M. Sato, “Interconnect for tightly coupled accelerators architecture,” IEEE 21st Annual Sympsium on High-Performance Interconnects (HOT Interconnects 21)”, 2013.
Y. Kodama, T. Hanawa, T. Boku, and M. Sato, “PEACH2: An FPGA-based PCIe network device for Tightly Coupled Accelerators,” Highly-Efficient Accelerators and Reconfigurable Technologies (HEART2014), pp.5-10, June 2014.
C. Tsuruta, Y. Miki, T. Kuhara, M. Umemura, and H. Amano, “Off-loading let generation to peach2: A switching hub for high performance gpu clusters,” International symposium on Highly Efficient Accelerators and Reconfigurable Technologies, pp.1-6, HEART'15, May 2015.
T. Kuhara, T. Kaneda, H. Amano, T. Hanawa, Y. Kodama, and T. Boku, “A preliminarily evaluation of peach3: A switching hub for tightly coupled accelerators,” Proc. of the International Symposium on Computing and Networking (CANDAR), pp.377-381, 2014.

前のページに戻る