抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
タスクアレイは,依存関係を持つタスクの2次元アレイである。各タスクは,左柱におけるいくつかのタスクの結果の値を使用し,従って,これらの左タスクを完了した後にのみ開始できる。従来のCUDA実装では,タスクのための計算を同期化するために,左から右への各カラムに対する分離CUDAカーネル呼を繰り返し実行する。しかしながら,この従来のCUDA実装にはいくつかの欠点がある。CUDAカーネル呼は一定のオーバーヘッドを持ち,CUDAカーネルの実行時間は最後に終了するCUDAブロックによって決定される。また,すべてのタスクは,次のタスクに対して低いメモリアクセス性能を持つグローバルメモリにおける結果としての値を書き込み,保存する必要がある。本論文の主な貢献は,タスクアレイを導入し,タスクアレイに対するこのようなオーバーヘッドを大幅に低減する単一カーネルソフト同期(SKSS)技術を提示することである。SKSSは,グローバルカウンタを用いてタスクアレイの各列に割り当てられたCUDAカーネルコールとCUDAブロックだけを実行する。著者らのSKSS技術の可能性を明らかにするために,著者らは,著者らのSKSS技術を使用するグレースケール画像の0-1ナップサック問題,合計面積テーブル計算,および誤差拡散のための動的計画法を実装し,以前に発表された最良GPU実装と比較した。非常に驚くべきことに,NVIDIA Titan Xを用いた実験結果は,SKSS実装が0-1ナップサック問題に対して1.29~2.11倍速く,合計面積テーブル計算に対して1.08~1.56倍速く,誤差拡散に対して1.61~2.11倍速いことを示した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【JST・京大機械翻訳】