文献
J-GLOBAL ID:202202281361371687   整理番号:22A0984709

xDNN:深層畳込みニューラルネットワークのための推論【JST・京大機械翻訳】

xDNN: Inference for Deep Convolutional Neural Networks
著者 (6件):
資料名:
巻: 15  号:ページ: 1-29  発行年: 2022年 
JST資料番号: W5705A  ISSN: 1936-7406  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
フィールドプログラマブルゲートアレイ(FPGA)と畳込みニューラルネットワーク(CNN)上で合成した特殊化ハードウェアプロセッサのファミリーに基づく深層学習推論のためのエンドツーエンドシステムであるxDNNを提案した。著者らは,バッチ処理なしで,低待ち時間,高スループット,および高計算効率のために最適化する設計を提示する。設計はスケーラブルで,多重累積ユニット数,オンチップメモリ階層,および数値精度のパラメトリック関数である。この設計は,埋込みデバイスのためのスケールダウンプロセッサを生成し,より大きなデバイスのためにより多くのコアを作り出すために複製し,または,効率を最適化するために再サイジングする。Xilinx Virtex Ultrascale+VU13P FPGA上で,ディジタル信号処理最大周波数に近い800MHzを達成し,オンチップ計算資源の80%以上の効率を達成した。このプロセッサファミリーのトップでは,異なる入力サイズ(即ち,224×224から2048×1024)に対する異なるネットワークの実行を可能にするランタイムシステムを提示する。ネイティブフレームワーク(すなわち,MXNet,Caffe,Keras,およびTensorflow)からCNNを読むコンパイラを提示して,それらを最適化し,コードを生成し,そして,性能推定を提供した。コンパイラは,ネイティブ環境からの量子化情報と最適化を結合して,任意のハードウェアエキスパートが書き込むことができるように,コードで実行時間を供給した。CPUコアとFPGAへの作業の分割のために,CNNを部分グラフに分割するツールを提示する。FPGA設計がASICになるとき,ソフトウェアが変化しないかどうかは,著者らの作業を垂直で,概念実証のFPGAプロジェクトではない。いくつかのネットワークに対する精度,待ち時間,および電力に対する実験結果を示し,要約すれば,GPUよりも4倍高いスループット,3倍良好な電力効率,および最新のCPUよりも20倍高いスループットを達成した。著者らが知る限りでは,任意の以前のFPGAベースソリューションよりも解が速く,他のトップ・オブ・サーバ・ソリューションに匹敵する。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
半導体集積回路  ,  パターン認識  ,  人工知能 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る