文献
J-GLOBAL ID:202002276111982277   整理番号:20A0700178

OSCAR自動並列化コンパイラとNECベクトル化コンパイラの協調によるベクトル・パーソナルスパコン上での自動ベクトル並列化

著者 (5件):
資料名:
巻: 2020  号: SLDM-191  ページ: Vol.2019-SLDM-191,No.26,1-6 (WEB ONLY)  発行年: 2020年02月20日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
科学技術計算や画像処理,機械学習等の分野において,プログラムの高速化が求められている.これらのプログラムが持つ高い並列性に着目した高速化手法として,ベクトル化と並列化が挙げられる.ベクトルプロセッサやGPGPU,SIMD命令を用いたベクトル化,マルチコアCPUを用いた並列化はこれまでも多く研究されてきた.本稿ではOSCAR自動並列化コンパイラとNECのベクトルプロセッサSX-Aurora TSUBASA用コンパイラを組み合わせた自動ベクトル並列化を提案する.本コンパイルフローの特徴は,OSCARコンパイラによるマルチグレイン並列化及びキャッシュ最適化と,NECコンパイラによる自動ベクトル化を組み合わせて利用することにより,ターゲットとなるSX-Aurora TSUBASAベクトルプロセッサ上のプログラム実行をさらに加速可能とすることにある.提案手法を,SPEC2000のswim及びNAS Parallel Benchmarks(NPB)のBT・CGを用いてSX-Aurora TSUBASA上で評価を行った.swimに対してはOSCAR自動並列化コンパイラの機能であるデータローカライゼーション手法を用いたキャッシュ最適化を適用した.OSCARコンパイラによる自動並列化とNECコンパイラによる自動ベクトル化の協調により,1コア上でのNECベクトル化単体に比べ.8コア使用時にSPEC2000swimで3.52倍の速度向上が得られた.また,NPB BTでも6.75倍,NPB CGで56.92倍の速度向上が確認できた。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
数値計算  ,  ディジタル計算機ハードウェア一般 
引用文献 (14件):
もっと見る

前のページに戻る