文献
J-GLOBAL ID:202302264422921840   整理番号:23A2235223

深層学習コンパイラTVMのベクトルマルチコア向けコード生成手法の検討

Investigation of code generation techniques for vector multicore targeting using the deep learning compiler TVM
著者 (8件):
資料名:
巻: 2023  号: ARC-254  ページ: Vol.2023-ARC-254,No.8,1-8 (WEB ONLY)  発行年: 2023年07月27日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自動運転車やスマートロボットなどのIoTデバイスのような組み込み機器においても,高度な判断や制御をするために,深層学習による推論処理が広く利用されつつある.しかしながら,画像入力に対する推論処理で多用される畳み込み演算は計算量が大きく,消費電力の増大とそれによる発熱量の増大を招いてしまい,その結果組み込み機器に大容量のバッテリーが必要となったり,冷却装置のための大きなスペースが必要となったりする懸念がある.これはスマートロボットなどにおいては行動自由度の低下や筐体の大きさにも影響を与える.これに対して筆者等は,コンパイラ協調のOSCARベクトルマルチコアによる,深層学習処理の高速かつ低消費電力実行の実現を目指している.本マルチコアでは,既存の多くの学習モデルを利用すべく,そのコンパイルツールチェーンに深層学習コンパイラTVMを取り入れる.本稿ではOSCAR自動並列化コンパイラとTVMによるベクトルマルチコア用コンパイルツールチェーンの有効性を示すべく,TVMによるベクトルマルチコア用コード生成手法を提案・実装する.さらに提案手法を実装したTVMをOSCARコンパイラおよびNECを組み合わせ,ResNetの学習済み深層学習モデルをNECのベクトルマルチコアであるSX-Aurora TSUBASA上で評価した.評価では上記TVMの生成コードをOSCARコンパイラで並列化し,さらにNECコンパイラによりベクトル化した.評価の結果,提案手法実装前後の同コア実行時の実行時間を比較すると,1コア実行時に13.7倍,8コア時に21.5倍の速度向上をそれぞれ得た.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
ニューロコンピュータ  ,  人工知能  ,  言語プロセッサ 
引用文献 (17件):

前のページに戻る