文献
J-GLOBAL ID:201602216404584975   整理番号:16A1111407

I/O分割による遅延隠蔽を用いたOut-of-coreなGPU Set Intersectionの性能評価(Unrefereed Workshop Manuscript)

著者 (9件):
資料名:
巻: 2016  号: HPC-155  ページ: Vol.2016-HPC-155,No.3,1-7 (WEB ONLY)  発行年: 2016年08月01日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
GPUアクセラレータと不揮発性メモリデバイスを考慮したOut-of-coreなSet Intersection手法ooc_set_intersectionを提案する。GPUの高い演算性能とメモリバンド幅を活かし,不揮発性メモリ,ホストメモリ,デバイスメモリ間のデータ移動に伴う遅延を隠蔽するために,対象となる入力レコード列をデバイスメモリに収まるサイズへチャンクに分割し,GPU上でのSet Intersection処理を非同期に行うことで,デバイスメモリやホストメモリの容量を超えたサイズのレコードに対するSet Intersectionを行う。提案手法をCPUがIntel Xeon E5-2699v3 2.30GHz(18コア)2ソケット,DRAMがDDR4-2133 128GB,SSDがHuawei ES3000v1PCIe SSD2.4TB,GPUがNVIDIA Tesla K40(GDDR5メモリ12GB)からなる1台のサーバで実験したところ,CPU上で実行可能なレコード総数の16倍,GPU上で実行可能なレコード総数の512倍となる236のint64_t型の整数値からなるランダムでユニークな2つの入力レコード(レコード総数は237(137,438,953,472))に対し,311,583,199records/secで動作し,2ソケット72スレッドで動作させたCPU版の非同期I/OによるOut-of-coreなSet InterSectionと比較して1.03倍の性能を示すことを確認した。また,これらの結果を踏まえ,GPUアクセラレータと不揮発性メモリを活用したビッグデータ処理カーネルのOut-of-core化に向けて性能上のボトルネックの調査を行い,高速化への指針を得た。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
制御方式  ,  専用演算制御装置 
引用文献 (15件):
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る