文献
J-GLOBAL ID:202002229378002828   整理番号:20A1930026

スパース畳込みニューラルネットワークのための再構成可能アクセラレータ【JST・京大機械翻訳】

A Reconfigurable Accelerator for Sparse Convolutional Neural Networks
著者 (2件):
資料名:
号: FPGA ’19  ページ: 119  発行年: 2019年 
JST資料番号: D0698C  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
畳込みニューラルネットワーク(CNN)は,画像認識および他のAIアプリケーションにおいて非常に有用であることが示されている。CNNは通常計算的に集約的である。圧倒的な計算要求の課題に対処するために,研究者は,シナプス重みの数および計算量を減らすためにネットワーク圧縮法を提案した。本論文では,スパースCNN計算を効率的に行うFPGA上の入力列ベーススパース畳込みニューラルネットワーク加速器を提案した。DNNWEAVERアーキテクチャと同様に,このアクセラレータは,複数の処理ユニット(PU)を有する2レベルアーキテクチャ階層も用いて,各PUは基本処理要素(PEs)の集合を構成する。単一PUにおけるPEの数と設計におけるPUの数は,最良の性能のための異なるCNNに対して再構成可能である。このアーキテクチャは,Cambricon-Xに必要なデータ選択のための大きなマルチプレクサを必要とせず,従って,高性能のためのより大きな加速器設計に適している。さらに,全体の計算効率を最大化するために,異なるPU上の計算負荷のバランスをとるための重み併合法を提案した。評価のために,著者らは32のPUと14のPEsによって,著者らの設計を実行した。非スパースVGG16ネットワークに対するDNNWEAVER実装と比較して,Xilinx ZC706ボード上で100MHzで動作する3.6x高速化の全体的性能を得て,297GOPSの速度を達成した。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  ニューロコンピュータ  ,  人工知能 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る