文献
J-GLOBAL ID:201702264513076442   整理番号:17A0797548

ディープニューラルネットワークの畳込み層のためのOpenCLカーネルの性能移植可能な自動チューニング【Powered by NICT】

Performance-Portable Autotuning of OpenCL Kernels for Convolutional Layers of Deep Neural Networks
著者 (4件):
資料名:
巻: 2016  号: MLHPC  ページ: 9-18  発行年: 2016年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
携帯と高度に最適化されたディープニューラルネットワーク(DNN)アルゴリズムとその実装技術を提案した。我々のアプローチは,自動調整と同様に性能マッチングを達成するデータレイアウトと低レベル最適化を適用する方法論的に既存のHPC技術および/またはリバースエンジニアリングと手作業組立符号化のいずれかが可能であるかまたは所有権売り手ライブラリーを超える新しい組合せである。前者はmaxDNN実現の内部で行った,後者はcuDNNによって表される。著者らの研究は,DNNワークフローの最も時間消費部分,すなわち,例えば,勾配を減少させ,局所最小に陥るのをによる停滞時再起動を必要とする場合がある,この訓練プロセスに直接適用できるであろう。最新高帯域幅メモリ(HBM)スタックを用いた消費者グレードのGPU上での性能試験の結果から,この方法が,価格の割合でサーバグレードハードウェアを適合できた。異なるベンダーからの新しいGPUアーキテクチャに関するもう一つの同調掃引はまた,筆者らのアプローチの可搬性と実装の品質を証明している。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
マーケティング  ,  計算機システム開発 

前のページに戻る