抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
データ集中型,ストリーミング適用を広範囲に高性能計算(HPC)システムの高い性能とスケーラビリティを探索した。これらアプリケーションでは,通常,複数の作業者への単一源からの実時間データの普及にブロードキャスト操作を利用し,それぞれがマルチGPUベース計算部位であった。最新の放送運用ノード間通信性能とスケーラビリティを向上させるためにInfiniBand(IB)ハードウェアマルチキャスト(MCAST)及びNVIDIA GPUDirect特徴を利用した。IB MCAST特徴はIB信頼できないデータグラム(UD)機構のみで動作し,その結果応用のための信頼性の低い通信を提供する。高レベルライブラリーおよび/または実行環境は信頼性を扱い,明示的な形で提供しなければならない。しかし,レベルで処理信頼性をストリーミングアプリケーションの性能ボトルネックになることがある。本論文では,ストリーミング応用の特定要求と取扱い信頼性に関与する性能ボトルネックを解析した。従来負確認応答(NACK)ベースのアプローチは,損失パケットの再送信を行う放送送信者を必要とし,ストリーミングスループットを劣化させることを示した。この問題を緩和するために,MPIレベルで高速信頼性支援を提供する新しいリモートメモリアクセス(RMA)に基づく方式を提案した。提案方式では,受信機自体(送信者とは対照的に)は,RMA操作により失われたパケットを回復した。さらに,著者らは,提案したRMAベース方式のメモリ要求を説明するために解析モデルを提供した。著者らの実験結果は,提案した方式が既存の解と比較してオーバヘッドを導入しないことを示した。注入障害(信頼性の低いネットワーク環境をシミュレートするため)を有するマイクロベンチマークでは,提案した方式は,既存のNACKベース方式と比較して潜時の45%までの減少を示した。合成ストリーミングベンチマークを用いた,著者らの設計は,88までのNVIDIA K80GPUカードを用いたGPU高密度Cray CSストームシステムに対する伝統的なNACKベース方式と比較して56%高い放送速度まで示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】