抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
画像識別等の組込み機器では学習済み深層畳み込みニューラルネットワーク(DCNN:Deep Convolutional Neural Network)の識別高速化と低消費電力化が求められている。DCNNの演算の90%以上は2次元畳み込みであり,主に積和(MAC:Multiply-Accumulation)演算である。本論文ではDCNNの入力値と重みを2値(-1/+1)に制限した2値化DCNNを組み込み向けFPGAとオフチップメモリ(QDR II+SSRAM)で実現する。提案手法はDSPブロックではなくメモリで実現するため電力効率に優れている。また,2値化DCNNの演算部を関数分解し,メモリを直列に接続したLUTカスケードで実現する。従って,単一メモリで実現する場合と比較してメモリ量を大幅に削減できる。本論文では,積和演算部の解析を行い,各レイヤ毎に適切なオンチップメモリを用いてLUTカスケードを実現する。DCNNのベンチマークであるCIFAR-10をNetFPGA-1G-CMLボード上に実現し既存のFPGA実現法と比較を行った結果,最も最新の実装法と比較して,面積効率で38.82倍優れており,消費電力効率で2.02倍優れていた。従って,2値化DCNNは既存のDCNNと比較して特に面積効率に優れているため安価な小型FPGAとSRAMを組合せて実現することができ,組込み用途に適している。(著者抄録)