文献
J-GLOBAL ID:202002253982574559   整理番号:20A2186590

Randomly Wired Convolutional Neural Networkを対象とするCNN推論アクセラレータのFPGA実装について

An FPGA-Based Low-Latency Accelerator for Randomly Wired Convolutional Neural Networks
著者 (2件):
資料名:
巻: 120  号: 168(RECONF2020 19-29)  ページ: 48-53 (WEB ONLY)  発行年: 2020年09月03日 
JST資料番号: U2030A  ISSN: 2432-6380  資料種別: 会議録 (C)
記事区分: 短報  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
畳み込みニューラルネットワーク(CNN)は組み込みシステムやデータセンターなどで広く使用されており,画像を対象とするタスクにおいて非常に高い認識精度を得ることができている.特にCNNをデータセンターで運用する際には,高認識精度・短レイテンシが重要となる.本研究ではランダムグラフを基にCNNモデルを構築する,Randomly Wired Convolutional Neural Network(RWCNN)を対象とした推論アクセラレータを提案する.RWCNNは並列処理可能な層数が多いため,複数の計算ユニットを並列に使用することによりレイテンシを短くすることが可能となる.複数の計算ユニットが同時に複数の特徴マップメモリにアクセスする必要があるため,特徴マップメモリとしてHBM2を使用する.HBMチャネルと各計算ユニットをクロスバースイッチを用いて配線することにより,効率的に入力特徴マップの選択を行う.RWCNNの各層を複数の計算ユニットに割り当てるスケジューリング問題を考え,割り当てられたスケジュールを基に干渉グラフの彩色を行い,各層の特徴マップを各HBMチャネルへと割り当てる.これにより,HBMチャネルへのアクセスを各計算ユニットで並列に行うことができるようになり,高速にRWCNNの処理を行うことができるようになる.提案アクセラレータをAlveo U50FPGA上に実装し,RWCNNと同等な計算コストであるResNet-50を対象とする推論アクセラレータとの比較を行う.ImageNet画像分類タスクにおいて,従来のアクセラレータよりもレイテンシを約43%短くすることができた.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  専用演算制御装置  ,  半導体集積回路 
引用文献 (25件):
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る