文献
J-GLOBAL ID:201802282063638818   整理番号:18A0704382

OSCARベクトルマルチコアプロセッサのための自動並列ベクトル化コンパイラフレームワーク

著者 (9件):
資料名:
巻: 117  号: 480(DC2017 89-106)  ページ: 71-76  発行年: 2018年02月28日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
科学技術計算や画像処理,機械学習の分野をはじめとして,アプリケーションの高速化が求められている。これらのアプリケーションの高速化を実現するために各種アクセラレータが利用されている。しかし,アクセラレータを有効に利用するためには,データ配置やホストとアクセラレータ間のデータ転送,同期などを考慮し,アクセラレータ用プログラムを作成する必要があり,プログラマが手動でこれらを行うには開発コストが大きくなる。これに対し,自動並列化やメモリ最適化技術を備えるOSCAR自動並列化コンパイラに自動ベクトル化技術を取り入れ,ペクトルアクセラレータを利用することにより,アプリケーションの高速化,低消費電力化を実現するとともに,開発コストの削減が可能だと考える。本稿では自動車,医療などの組み込みシステムからハイパフォーマンスコンピューティングまで利用できる低消費電力高性能OSCARベクトルマルチコアプロセッサのソフトウェア開発期間を最小化し,誰にでも使いやすい環境を提供するための自動並列ベクトル化コンパイラのフレームワークを提案する。提案フレームワークに基づいてOSCARコンパイラに拡張実装を行った自動ベクトル化の詳細についても述べる。本フレームワークを利用し,自動生成を行ったベクトル化プログラムに対してベクトルマルチコアシミュレータ上で性能評価を行ったところ,2つのCPUコアと2つのアクセラレータコアで実行した場合,1つのCPUコアのみによる実行と比べて,行列積では28.21倍,2DConvolutionでは8.08倍の性能向上が得られた。FPGAで実装されたベクトルマルチコアエミュレータ上で行列積の性能評価を行ったところ,1つのCPUコアと1つのアクセラレータコアで実行した場合,1つのCPUコアのみによる実行と比べて,24.91倍の速度向上が得られた。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
言語プロセッサ  ,  演算方式 
引用文献 (10件):
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る