LLVMを用いたベクトルアクセラレータ用コードのコンパイル手法

丸岡晃; 無州祐也; 狩野哲史; 持山貴司; 北村俊明; 神谷幸男; 高村守幸; 木村啓二; 笠原博徳

文献

J-GLOBAL ID：201602222830071563 整理番号：16A0925223

LLVMを用いたベクトルアクセラレータ用コードのコンパイル手法

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=16A0925223&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=16A0925223&from=J-GLOBAL&jstjournalNo=S0532B") }}

著者 (9件)： , , , , , , , ,
資料名：
巻： 116 号： 177(CPSY2016 10-40) ページ： 19-24 発行年： 2016年08月01日
JST資料番号： S0532B ISSN： 0913-5685 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

科学技術計算や画像処理,機械学習の分野を始めとして,アプリケーションの高速化を実現するために各種アクセラレータが利用されている。アクセラレータを有効利用するためには対象アクセラレータに適したプログラムやデータ配置の最適化,ホストとアクセラレータ間のデータ転送や同期などの挿入が必要になるが,これらをプログラマが手動で行うことは困難であり,コンパイラによる自動化が望まれる。筆者等はこれまでOSCAR自動並列化コンパイラにより,マルチコアプロセッサを対象として自動並列化に加えてメモリ最適化及びデータ転送最適化技術を開発してきた。このOSCARコンパイラに対し自動ベクトル化技術で多くの実績を持つベクトルプロセッサの技術を取り入れ,さらにベクトルアクセラレータを利用することで,高速化及び低消費電力化を達成しつつプログラムの生産性を大幅に改善することが出来ると考える。本稿ではOSCARコンパイラが対象としてきたOSCARマルチコアアーキテクチャにベクトルアクセラレータを加えた,プラチナマルチコアアーキテクチャ用の自動並列化・最適化を可能とするコンパイルフローを提案する。提案コンパイルフローではOSCARコンパイラによるコンパイル後のベクトルアクセラレータのコード生成にLLVMを利用しており,その実装の詳細も述べる。手動ベクトル化を行った主要カーネルに対してプラチナマルチコアシミュレータを用いて性能評価を行ったところ,1つのCPUコア及び1つのアクセラレータコアを使用した場合,1つのCPUコアのみによる実行と比較して行列積で20.06倍,2DConvolutionで22.23倍の性能向上が得られることが確かめられた。(著者抄録)

, , , , , , , , , , , , , , ,
, ,

言語プロセッサ , ディジタル計算機方式一般

, , , ,

前のページに戻る