文献
J-GLOBAL ID:201702263888605145   整理番号:17A1635390

kepler GPU上でのコンボリューションカーネルのための記憶効率の最適化【Powered by NICT】

Optimizing memory efficiency for convolution kernels on kepler GPUs
著者 (4件):
資料名:
巻: 2017  号: DAC  ページ: 1-6  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
畳込みは,多くの応用の基本的操作で,コンピュータビジョン,自然言語処理,画像処理,等に用いられている。種々の深い学習応用における畳込みニューラルネットワークの最近の成功は,高速畳込みにも高い要求を置いた。グラフィックス処理ユニット(GPU)の高い計算スループットおよびメモリ帯域幅は,GPU畳込み操作を加速するための自然な選択にしている。しかし,畳込みのためのGPUの利用可能なメモリ帯域幅を利用した最大挑戦的な課題である。本論文では,GPUのメモリバンク幅と糸の計算データ幅の間の不整合に対処するための一般的なモデルを紹介した。このモデルに基づいて,二つの畳込みカーネル,一般的な事例一つと一つの入力チャネルを持つ特別な場合に他を開発した。メモリアクセスパターンと計算パターンを注意深く最適化することにより,特別な場合のための通信最適化カーネルおよび一般的な場合の通信減少カーネルを設計した。Kepler GPU上での実装に基づく実験データは筆者らのカーネルは最新cuDNNライブラリー上の5.16×と35.5%の平均性能向上を達成するために,特別な場合と一般的な場合のであることを示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る