文献
J-GLOBAL ID:201702241910986759   整理番号:17A1426274

DINO:HPCにおける持続的冗長性の異なる節クローニング【Powered by NICT】

DINO: Divergent node cloning for sustained redundancy in HPC
著者 (4件):
資料名:
巻: 109  ページ: 350-362  発行年: 2017年 
JST資料番号: D0613B  ISSN: 0743-7315  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
フェイルストップ挙動に取り組む現代チェックポイント/リスタート(C/R)法では不十分であることをこのような次世代のHPCシステムの複雑さとスケールは,故障回復力法における重要な課題を提起している。冗長計算は極端な規模での代替として提案されている。三重冗長性は,また,投票によるサイレントデータ破損(SDC)と,正しい結果を検出できるC/Rよりも優れていた。しかし,電流冗長計算アプローチは,破損または破損したレプリカを修復しなかった。システムは投票能力を持たない二重冗長性に分解されたので,SDCはレプリカ破壊後に検出できる。投票は,残りの二レプリカ間の不整合の結果を明らかにする場合は流産しなければならない。レプリカである論理的等価が,ジョブ実行中に多様な実行時状態,動的に新しいレプリカを生成する単純への挑戦を提示するがあるかもしれない。この問題は,DIvergent NOdeクローニング(DINO),ハード故障から回復する迅速な実行環境で検討した。DINOはレプリカオンザフライ間で異なる状態を緻密化するための問題を解決するMPI実行時システムと統合された新規なノードクローニングサービスから構成されている。DINOを用いて,二重冗長性分解後,良好なレプリカを迅速にクローン化できる三重冗長性が回復した。9NAS Parallel Benchmarks(NPB),Sweep3DとLULESH上の実験結果を示した。結果は,アプローチの適用性と回復過程の正当性を確認し,DINOはほぼ瞬時に故障から回復できることを示した。クローニングオーバヘッドはクローン操作の発信元と宛先の間を移動する必要があることをプロセス画像サイズに依存し,5.60~90.48秒の間で変化する著者らのモデルによるシミュレーション結果は,DINO回収を伴う二重冗長性は常に2xよりも優れており,百万ノードまで3x冗長性を上回ることを示した。著者らの知る限り,冗長なMPIコンピューティングにおけるレプリカ破損を修復するための設計と実装は前例がない。Copyright 2017 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
ディジタル計算機方式一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る