文献
J-GLOBAL ID:202002239484678870   整理番号:20A2258383

DNNVM:FPGAベースCNN加速器上の異種最適化を採用するエンドツーエンドコンパイラ【JST・京大機械翻訳】

DNNVM: End-to-End Compiler Leveraging Heterogeneous Optimizations on FPGA-Based CNN Accelerators
著者 (9件):
資料名:
巻: 39  号: 10  ページ: 2668-2681  発行年: 2020年 
JST資料番号: B0142C  ISSN: 0278-0070  CODEN: ITCSDI  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
畳み込みニューラルネットワーク(CNN)は,近年,いくつかの人工知能ドメインのための最先端の方法になった。ますます複雑なCNNモデルは,計算結合とI/O結合の両方である。カスタム命令セットアーキテクチャ(ISA)によって駆動されるフィールドプログラマブルゲートアレイベース加速器は,普遍性と効率の間のバランスを達成するが,それらには,最適化されるものが多い。グラフ,ループおよびデータレイアウト,アセンブル,ランタイムサポート,および検証環境に対する最適化者の統合である,完全スタックコンパイラ深層ニューラルネットワーク仮想マシン(DNNVM)を提案した。DNNVMは深層学習フレームワークの文脈で動作し,CNNモデルを有向非巡回グラフ:X→∞に変換する。X→∞に基づいて,著者らは,データレイアウトとパイプラインの両方に対する最適化課題をグラフレベル問題に変換した。DNNVMは,パイプラインとデータレイアウト最適化を活用し,全体の計算グラフの実行戦略の最良の選択を探索するために,発見的部分グラフ同形写像アルゴリズムによって,すべての潜在的に有益な融合機会を列挙する。Xilinx ZU_2@330MHzとZU9@330MHzにおいて,最適化なしでナイーブな実装によって,著者らのベンチマークに関する等価の最先端の性能を達成して,スループットは,DNNVMにおける不均一最適化をレバレッジすることによって,さらに1.26×まで改良した。最後に,ZU9@330MHzで,VGGとResNet50のための最先端の性能を達成した。VGGに対して2.82TOP/sのスループットと123.7GOP/s/Wのエネルギー効率を達成した。さらに,ResNet50に対して1.38TOP/s,GoogleNetに対して1.41TOP/sを達成した。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
CAD,CAM  ,  集積回路一般  ,  半導体集積回路 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る