文献
J-GLOBAL ID:201702214951234031   整理番号:17A1118889

TOAST:GPU上での反復ステンシル計算のための自動タイリング【Powered by NICT】

TOAST: Automatic tiling for iterative stencil computations on GPUs
著者 (4件):
資料名:
巻: 29  号:ページ: null  発行年: 2017年 
JST資料番号: W2542A  ISSN: 1532-0626  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ステンシルパターンは多くの科学および工学領域において重要であり,研究者および産業界から大きな関心に拍車をかけた。近年,グラフィックス処理ユニット(GPU)上で動作する並列ステンシルアプリケーションのために提案されている最適化。特に,タイリングはデータ局所性を改善することにより,ホストメモリとGPUの間の通信の容量を減らすことによりアプリケーション性能を著しく向上させることができる技術である。さらに,タイリングは物理的GPUメモリよりも大きいことをプロセス入力に対するステンシルの応用を可能にする。しかし効率的タイリングを実行は複雑で,時間がかかり,誤りを犯しやすい。本論文では,透過的に最適化された自動ステンシルタイリング(TOAST),GPU上で走行する反復ステンシル計算のための自動タイリング機構を提案した。TOASTは三つの主要な利点を備える。(1)動力学的に利用可能なGPUメモリ量を尊重しながら,タイル内のデータ再利用を最大化しようとする最適化モデルを組み込んだ;(2)ステンシル計算のための仮想化されたGPUメモリを提供し,大きな入力データを可能にするおよび(3)並列ステンシルの応用開発者に最適タイリングを行う透過。TOASTの現在の実装は,遺伝的アルゴリズムに基づく内部ソルバとPSkelフレームワークを増大させる。著者らの実験結果は,TOASTはマルチスレッド(中央処理ユニット)最適化バージョンとGPU上でナイーブタイリング法と比較して48倍までと比較して13×まで反復ステンシルアプリケーションの性能を改善することを示した。TOAST機構である実際のステンシル計算と比較してデータ管理の低上回り,オーバヘッドを自動的に達成するためにできた。Copyright 2017 Wiley Publishing Japan K.K. All Rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
専用演算制御装置  ,  図形・画像処理一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る