抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
画像識別等の組込み機器では学習済み深層畳み込みニューラルネットワーク(DCNN:Deep Convolutional Neural Network)の識別高速化が求められている。DCNNの演算の90%以上は2次元畳み込みであり,主に積和(MAC:Multiply-Accumulation)演算が行われている。現行のFPGAはMAC演算用のDSPブロック(Xilinx社FPGAではDSP48Eブロック)を搭載しているが,大規模なDCNNを実現する際,大量のDSPブロックが必要である。nビットの乗算はO(n・2
2n)の面積を必要とするため,入力数nを分解すれば面積を削減できる。本論文では剰余数系(RNS:Residue Number System)を改良したNested RNSを新たに提案する。Nested RNSはRNSで分割された数を更にRNSで分割することを繰り返す。Nested RNSでは乗算器の入力数を削減できるので,積和演算回路をコンパクトに実現できる。入力数nが分割されるため,コンパクトな回路で並列処理でき,かつ動作周波数が上がる。Nested RNSを適用したDCNNの一種であるImageNetをVirtex 7 VC707評価ボードに実装した。単位Slice当りの演算回数効率に関して,最も優れた既存手法と比較して5.81倍優れていた。(著者抄録)