抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
畳込みニューラルネットワーク(CNN)は,画像認識および他のAIアプリケーションにおいて非常に有用であることが示されている。CNNは通常計算的に集約的である。圧倒的な計算要求の課題に対処するために,研究者は,シナプス重みの数および計算量を減らすためにネットワーク圧縮法を提案した。本論文では,スパースCNN計算を効率的に行うFPGA上の入力列ベーススパース畳込みニューラルネットワーク加速器を提案した。DNNWEAVERアーキテクチャと同様に,このアクセラレータは,複数の処理ユニット(PU)を有する2レベルアーキテクチャ階層も用いて,各PUは基本処理要素(PEs)の集合を構成する。単一PUにおけるPEの数と設計におけるPUの数は,最良の性能のための異なるCNNに対して再構成可能である。このアーキテクチャは,Cambricon-Xに必要なデータ選択のための大きなマルチプレクサを必要とせず,従って,高性能のためのより大きな加速器設計に適している。さらに,全体の計算効率を最大化するために,異なるPU上の計算負荷のバランスをとるための重み併合法を提案した。評価のために,著者らは32のPUと14のPEsによって,著者らの設計を実行した。非スパースVGG16ネットワークに対するDNNWEAVER実装と比較して,Xilinx ZC706ボード上で100MHzで動作する3.6x高速化の全体的性能を得て,297GOPSの速度を達成した。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】