抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
畳み込みニューラルネットワーク(CNN)は組み込みシステムやデータセンターなどで広く使用されており,画像を対象とするタスクにおいて非常に高い認識精度を得ることができている.特にCNNをデータセンターで運用する際には,高認識精度・短レイテンシが重要となる.本研究ではランダムグラフを基にCNNモデルを構築する,Randomly Wired Convolutional Neural Network(RWCNN)を対象とした推論アクセラレータを提案する.RWCNNは並列処理可能な層数が多いため,複数の計算ユニットを並列に使用することによりレイテンシを短くすることが可能となる.複数の計算ユニットが同時に複数の特徴マップメモリにアクセスする必要があるため,特徴マップメモリとしてHBM2を使用する.HBMチャネルと各計算ユニットをクロスバースイッチを用いて配線することにより,効率的に入力特徴マップの選択を行う.RWCNNの各層を複数の計算ユニットに割り当てるスケジューリング問題を考え,割り当てられたスケジュールを基に干渉グラフの彩色を行い,各層の特徴マップを各HBMチャネルへと割り当てる.これにより,HBMチャネルへのアクセスを各計算ユニットで並列に行うことができるようになり,高速にRWCNNの処理を行うことができるようになる.提案アクセラレータをAlveo U50FPGA上に実装し,RWCNNと同等な計算コストであるResNet-50を対象とする推論アクセラレータとの比較を行う.ImageNet画像分類タスクにおいて,従来のアクセラレータよりもレイテンシを約43%短くすることができた.(著者抄録)