文献
J-GLOBAL ID:201802217921539924   整理番号:18A0845705

CUDAにより可能になったGPU上のタスクアレイのための単一カーネルソフト同期技術とその応用【JST・京大機械翻訳】

Single Kernel Soft Synchronization Technique for Task Arrays on CUDA-enabled GPUs, with Applications
著者 (3件):
資料名:
巻: 2017  号: CANDAR  ページ: 11-20  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
タスクアレイは,依存関係を持つタスクの2次元アレイである。各タスクは,左柱におけるいくつかのタスクの結果の値を使用し,従って,これらの左タスクを完了した後にのみ開始できる。従来のCUDA実装では,タスクのための計算を同期化するために,左から右への各カラムに対する分離CUDAカーネル呼を繰り返し実行する。しかしながら,この従来のCUDA実装にはいくつかの欠点がある。CUDAカーネル呼は一定のオーバーヘッドを持ち,CUDAカーネルの実行時間は最後に終了するCUDAブロックによって決定される。また,すべてのタスクは,次のタスクに対して低いメモリアクセス性能を持つグローバルメモリにおける結果としての値を書き込み,保存する必要がある。本論文の主な貢献は,タスクアレイを導入し,タスクアレイに対するこのようなオーバーヘッドを大幅に低減する単一カーネルソフト同期(SKSS)技術を提示することである。SKSSは,グローバルカウンタを用いてタスクアレイの各列に割り当てられたCUDAカーネルコールとCUDAブロックだけを実行する。著者らのSKSS技術の可能性を明らかにするために,著者らは,著者らのSKSS技術を使用するグレースケール画像の0-1ナップサック問題,合計面積テーブル計算,および誤差拡散のための動的計画法を実装し,以前に発表された最良GPU実装と比較した。非常に驚くべきことに,NVIDIA Titan Xを用いた実験結果は,SKSS実装が0-1ナップサック問題に対して1.29~2.11倍速く,合計面積テーブル計算に対して1.08~1.56倍速く,誤差拡散に対して1.61~2.11倍速いことを示した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
オペレーティングシステム  ,  ディジタル計算機方式一般  ,  数理計画法 

前のページに戻る