抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
GPUは単純なコヒーレンス演算のみをサポートする。データインテグリティのために,重重量同期操作を明示的に使用しなければならない。通信がスレッドの部分集合を横断するとき,低いオーバヘッド通信を容易にするために,スコピック同期Hower et al.(2014)とGaster et al.(2015)を導入した。共有が静的であるならば,同期を使用することができる。しかし,共有が動的である時,重重量グローバルスコープ同期を使用することは不可能である。非対称共有は,共有データが単一エージェントによって頻繁にアクセスされ,一方,遠隔エージェントによってほとんどアクセスされない動的共有パターンの1つである。それは,特別なサポートなしでGPUデバイスにすべての可能な同期エージェントを包含するために,グローバルスコープ同期を使用する必要がある。遠隔範囲促進(RSP)Orr et al.(2015)は,頻繁なアクセスのための軽量局所スコープ同期の使用を可能にし,希少遠隔アクセスへの最も同期オーバヘッドをデフターする。RSP意味論の効率的でスケーラブルな実装であるsRSPを提案した。遠隔スコープ同期を実行するとき,それは,選択的に高価なキャッシュ操作を適用する。筆者等の研究を徹底的に評価し,それが遠隔同期オーバヘッドを著しく減らし,より良くスケールすることを示した。平均して,64個の計算ユニットを有するGPU装置に対して,約25%の性能を改善する。Copyright 2022 Wiley Publishing Japan K.K. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】