抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
GPUアクセラレータと不揮発性メモリデバイスを考慮したOut-of-coreなSet Intersection手法ooc_set_intersectionを提案する。GPUの高い演算性能とメモリバンド幅を活かし,不揮発性メモリ,ホストメモリ,デバイスメモリ間のデータ移動に伴う遅延を隠蔽するために,対象となる入力レコード列をデバイスメモリに収まるサイズへチャンクに分割し,GPU上でのSet Intersection処理を非同期に行うことで,デバイスメモリやホストメモリの容量を超えたサイズのレコードに対するSet Intersectionを行う。提案手法をCPUがIntel Xeon E5-2699v3 2.30GHz(18コア)2ソケット,DRAMがDDR4-2133 128GB,SSDがHuawei ES3000v1PCIe SSD2.4TB,GPUがNVIDIA Tesla K40(GDDR5メモリ12GB)からなる1台のサーバで実験したところ,CPU上で実行可能なレコード総数の16倍,GPU上で実行可能なレコード総数の512倍となる2
36のint64_t型の整数値からなるランダムでユニークな2つの入力レコード(レコード総数は2
37(137,438,953,472))に対し,311,583,199records/secで動作し,2ソケット72スレッドで動作させたCPU版の非同期I/OによるOut-of-coreなSet InterSectionと比較して1.03倍の性能を示すことを確認した。また,これらの結果を踏まえ,GPUアクセラレータと不揮発性メモリを活用したビッグデータ処理カーネルのOut-of-core化に向けて性能上のボトルネックの調査を行い,高速化への指針を得た。(著者抄録)