抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ディープラーニングは高性能な認識率を持つため様々な組込み機器に適用する機会があるが,CPUは遅くGPUは消費電力が大きく,ASICは設計期間が長いため短期間に進歩し続けている現状ではTATの観点から適しない。したがって,再構成可能で電力効率に優れたFPGAが組込みディープラーニングに適していると考えられる。ディープラーニングは学習と推論のフェーズに大別されるが,現状ではそれぞれの設計に異なる言語とプラットフォームが必要であり,ソフトとハードの両方の知識が必要でありその設計難易度は極めて高く問題であった。我々は推論と学習のコードをそれぞれ自動生成しGUIで設計可能なGUINNESS(GUI based binarized neural network synthesizer)を開発している。GUINNESSはハードウェア実現に適した2値化畳み込みニューラルネットワーク(BCNN:Binarized Convolutional Neural Network)をサポートしており,全てのコードを自動生成するため,短期間で高性能なBCNNをFPGAに実現できる。本論文ではFPGA上にBCNNを実現するための最適化手法を紹介し,GUINNESSのツールフローについて述べる。また,Digilent社Zedboard上にベンチマークBCNNであるVGG11を実現し,NVidia社Jetson TX1との比較を行った。ARM Cortex-A57プロセッサと比較して,FPGA実現は1776.3倍高速であり,消費電力は約3分の1であり,電力性能効率で5706.3倍優れていた。また,NVidia Maxwell GPUと比較して,11.5倍高速であり,消費電力は約7分の1であり,電力性能効率は83.0倍優れていた。FPGA実現の欠点は専用回路の論理合成・配置配線に要する追加時間であるが,実験では約3時間であり,学習時間72時間と比較して影響が少ない値であった。(著者抄録)