文献
J-GLOBAL ID:202002269278029223   整理番号:20A0900418

異種多コアアーキテクチャにおけるストリーミング並列性の最適化【JST・京大機械翻訳】

Optimizing Streaming Parallelism on Heterogeneous Many-Core Architectures
著者 (6件):
資料名:
巻: 31  号:ページ: 1878-1896  発行年: 2020年 
JST資料番号: T0882A  ISSN: 1045-9219  CODEN: ITDSEO  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多コア加速器はより多くの処理装置を統合するので,すべての利用可能な資源の効果的な利用を行うための並列アプリケーションに対してますます困難になっている。ハードウェア利用を改善する効果的な方法は,不均一ストリーミングとして知られている戦略である多重化計算と通信タスクにより,不均一処理ユニットの空間的および時間的共有を利用することである。効果的な不均一ストリーミングを達成するには,タスク間のハードウェアを注意深く分割し,タスク並列性の粒度を資源分割に適合させる必要がある。しかし,多くの可能な解があり,最適解がプログラムとデータセットを横切って変化するので,正しい資源分割とタスク粒度の発見は非常に困難である。本論文では,不均一多コアアーキテクチャ上でのタスクベース並列アプリケーションに対するハードウェア資源分割とタスク粒度のための良好な解を迅速に導出するための自動アプローチを提案した。著者らのアプローチは,与えられた資源分割とタスク粒度構成の下で目標アプリケーションの結果としての性能を推定するために性能モデルを採用する。このモデルは,実行時の良好な構成を迅速に探索するための効用として使用される。低レベルのハードウェアの詳細にエキスパートの洞察を必要とする解析モデルを手に入れる代わりに,機械学習技術を用いて自動的に学習する。著者らは,最初に,訓練プログラムを用いてオフラインで予測モデルを学習することによってこれを達成した。学習されたモデルは,実行時間における任意の見えないプログラムの性能を予測するために用いることができる。この手法を39の代表的な並列アプリケーションに適用し,2つの代表的な不均一多コアプラットフォーム,CPU-XeonPhiプラットフォームとCPU-GPUプラットフォーム上で評価した。単一ストリームバージョンと比較して,著者らのアプローチは,それぞれ,XeonPhiとGPUプラットフォーム上で,1.6xと1.1xの高速化を達成した。これらの結果は,理論的に完全な予測器によって提供される性能の93%以上に変換する。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
専用演算制御装置  ,  パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る