文献
J-GLOBAL ID:202102291370534225   整理番号:21A1476359

ピーク性能を超えて:AI最適化FPGAとGPUの実性能の比較【JST・京大機械翻訳】

Beyond Peak Performance: Comparing the Real Performance of AI-Optimized FPGAs and GPUs
著者 (8件):
資料名:
巻: 2020  号: ICFPT  ページ: 10-19  発行年: 2020年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
人工知能(AI)の増大する重要性と計算要求は,ドメイン最適化ハードウェアプラットフォームの出現につながった。例えば,Nvidia GPUsは,深い学習(DL)計算をスピードアップするためにマトリックス操作のために特殊化したテンソルコアを導入し,T4GPUにおいて130t8のTOPSまでの非常に高いピークスループットをもたらした。最近,Intelは,その最初のAI最適化14nm FPGA,Stratix10 NX,を12nm GPUに匹敵する143int8 TOPSまでの推定ピーク性能を提供する,ファブリックAIテンソルブロックと共に導入した。しかし,実際にはどの事項がピーク性能ではなく,目標作業負荷に関する実際の達成可能な性能である。これは,主にテンソルユニットの利用と,システムレベルオーバヘッドが,加速器から/へデータを送るのに依存する。本論文では,IntelのAI最適化FPGA,Stratix 10 NXの最初の性能評価を,最新のアクセス可能なAI最適化GPU,Nvidia T4およびV100と比較し,実時間DL推論作業負荷の大規模セットについて提示した。著者らは,FPGAのAIテンソルブロックを利用するために,脳波NPUオーバレイアーキテクチャの再実装を強化して,ループにおけるFPGAEDAツールなしで,ソフトウェアを通して純粋にテンソルブロックをプログラムするのを可能にするツールチェーンサポートを開発した。最初に,テンソルブロックのないStratix10GX/MXバージョンに対してStratix10NX NPUを比較し,次に,T4およびV100GPUsに対する詳細なコア計算およびシステムレベル性能比較を提示した。著者らは,Stratix10NX上の著者らの強化されたNPUがGPUsより良いテンソルブロック利用を達成して,バッチ6でT4とV100GPUsの上で24と12の平均的計算高速化をもたらすことを示す。32のバッチサイズを可能にする緩和待ち時間制約でも,T4とV100GPUに対して,それぞれ5と2の平均的高速化を達成した。システムレベルに関して,その統合100Gbps EthernetによるFPGAの微細粒柔軟性は,短および長シーケンスRNNに対して,128Gbps PCIによるV100 GPUへの局所アクセスよりも,それぞれ10 および2 < システムオーバヘッド待ち時間で遠隔アクセスを可能にした。Copyright 2021 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る