文献
J-GLOBAL ID:201902224226273188   整理番号:19A0955826

マルチGPU環境におけるスパンニング木による並列抽出アルゴリズムの最適化

Optimization in the parallelism extraction algorithm with spanning tree on a multi-GPU environment
著者 (3件):
資料名:
巻: 14  号:ページ: 862-869  発行年: 2019年06月 
JST資料番号: W1854A  ISSN: 1931-4973  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,並列性を自動的に利用し,分散環境における複数のカーネルプログラムの実行順序を決定するスパンニング木を用いた並列抽出アルゴリズムの最適化手法を提案した。ストリームベースコンピューティングにおいて,効率的な並列実行はカーネルプログラム起動の注意深いスケジューリングを必要とする。カーネルをノードに写像し,I/Oストリームをエッジに写像することにより,全体のストリームプロセスをスパンニング木として扱うことができる。フィードバックとフィードフォワードエッジを可能にするスパンニング木は,カーネル間に存在する依存性を表現するのに有効である。スパンニング木において,同じ深さにおけるノードはそれらの間にエッジを持たず,したがって,ケース親ノードにおいて並列に実行することができた。一連のノードはパイプラインで実行できる。このように,提案したアルゴリズムは,空間的および時間的並列性の両方を抽出することができた。しかし,このアルゴリズムをフィードバックに適用すれば,ノード間のループの完了を待つため,時間の浪費を引き起こす。この問題を解決するために,並列パターンを,並列性の程度を増加させるために通信パターンを生成するステップで最適化することができた。さらに,カーネル間の実行時間の違いのために,アルゴリズムの最適化のために負荷バランスを考慮することができる。最適化アルゴリズムの有効性を評価するために,k-平均応用を開発して,特にフィードバック処理のために並列化した。結果は,グラフィックス処理ユニット(GPU)クラスタの2つのノードを用いた並列実行が1.5倍の高速化を得たことを示した。負荷分散により,単一GPU上での実行と比較して,クラスタの4つのノードを用いた並列実行は,2D-FFTにおいて3.5倍高速化し,LU分解において3.0倍高速化した。Copyright 2019 Wiley Publishing Japan K.K. All rights reserved. Translated from English into Japanese by JST.
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
計算理論 

前のページに戻る