プレプリント
J-GLOBAL ID:202202220292452939   整理番号:21P0071756

トポロジーと故障を意識したプロセス配置によるMPI並列ジョブの性能と回復力の改善【JST・京大機械翻訳】

Improving the Performance and Resilience of MPI Parallel Jobs with Topology and Fault-Aware Process Placement
著者 (3件):
資料名:
発行年: 2020年12月29日  プレプリントサーバーでの情報更新日: 2021年01月05日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
HPCシステムは,性能および計算資源に対する絶えず増加する需要に適合するために,サイズで成長している。性能の増加とは別に,大規模システムは,更なる成長を妨げる2つの課題に直面している:エネルギー効率と弾力性。同時に,システム性能を追求するアプリケーションは,システム資源を利用するための高度な並列性に依存し,それはシステム相互接続に対する圧力の増加につながる。大規模システムスケールでは,通信局所性の増加が,アプリケーション性能とエネルギー消費の両方の点で有益である。この方向に向けて,通信コストが低減する方法で,システムノードへのアプリケーションプロセスのマッピングを導くいくつかの研究に焦点を当てた。一般的手法は,グラフとしてアプリケーションの通信パターンとシステムアーキテクチャの両方を表現することであり,次に対応するマッピング問題を解決する。通信コストとは別に,ジョブの完了時間はノード故障によっても影響を受ける。ノード故障は,仕事の再開を要求し,仕事の再開を必要とする。本論文では,ノード故障を考慮しながら,通信コストを低減する目的で,システム資源にプロセスを割り当てる問題に取り組んだ。提案した方式を,Surm資源管理者に統合した。評価結果は,少数のノードが低故障確率を持つシナリオにおいて,提案したプロセス配置アプローチがMPIジョブのバッチの完了時間において顕著な減少を達成することを示した。Surmにおけるデフォルトプロセス配置アプローチと比較して,2つの異なるMPI応用に対して,それぞれ18.9%および31%の削減であった。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
ディジタル計算機方式一般  ,  計算機システム開発 

前のページに戻る