文献
J-GLOBAL ID:201602222830071563   整理番号:16A0925223

LLVMを用いたベクトルアクセラレータ用コードのコンパイル手法

著者 (9件):
資料名:
巻: 116  号: 177(CPSY2016 10-40)  ページ: 19-24  発行年: 2016年08月01日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
科学技術計算や画像処理,機械学習の分野を始めとして,アプリケーションの高速化を実現するために各種アクセラレータが利用されている。アクセラレータを有効利用するためには対象アクセラレータに適したプログラムやデータ配置の最適化,ホストとアクセラレータ間のデータ転送や同期などの挿入が必要になるが,これらをプログラマが手動で行うことは困難であり,コンパイラによる自動化が望まれる。筆者等はこれまでOSCAR自動並列化コンパイラにより,マルチコアプロセッサを対象として自動並列化に加えてメモリ最適化及びデータ転送最適化技術を開発してきた。このOSCARコンパイラに対し自動ベクトル化技術で多くの実績を持つベクトルプロセッサの技術を取り入れ,さらにベクトルアクセラレータを利用することで,高速化及び低消費電力化を達成しつつプログラムの生産性を大幅に改善することが出来ると考える。本稿ではOSCARコンパイラが対象としてきたOSCARマルチコアアーキテクチャにベクトルアクセラレータを加えた,プラチナマルチコアアーキテクチャ用の自動並列化・最適化を可能とするコンパイルフローを提案する。提案コンパイルフローではOSCARコンパイラによるコンパイル後のベクトルアクセラレータのコード生成にLLVMを利用しており,その実装の詳細も述べる。手動ベクトル化を行った主要カーネルに対してプラチナマルチコアシミュレータを用いて性能評価を行ったところ,1つのCPUコア及び1つのアクセラレータコアを使用した場合,1つのCPUコアのみによる実行と比較して行列積で20.06倍,2DConvolutionで22.23倍の性能向上が得られることが確かめられた。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
言語プロセッサ  ,  ディジタル計算機方式一般 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る