抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,計算機の大規模化が進む中で,局所的な通信パターンを持つ隣接通信が注目を集めている。しかし,ネットワークアーキテクチャを考慮した隣接集団通信アルゴリズムの研究は進んでいない。そこで,本研究ではメッシュ/トーラスのような直接網で接続された複数の通信デバイスを持つ並列計算機を対象とした隣接集団通信アルゴリズムの提案を行った。提案した隣接集団通信アルゴリズムでは隣接プロセス数と通信デバイス数の関係を考慮してメッセージをセグメントに分割し,同量のメッセージを全通信デバイスに割り付ける。これによりすべての通信デバイスの通信帯域幅を使い切ることができ通信性能を向上させる。そこで提案した隣接集団通信アルゴリズムの有効性を示すため,RDMAインタフェースおよびMPI関数による実装を行い,京コンピュータ互換機であるFX10において性能評価実験を行った。FX10は通信デバイスを4基搭載し,仮想3次元トーラストポロジとしてアクセスが可能であるため,提案アルゴリズムによる性能向上が期待できる。性能評価実験では,MPI関数による実装において既存の隣接集団通信アルゴリズムに対して2倍の性能向上を示した。また,同様にRDMAインタフェースによる実装において25%の性能向上を示した。さらに熱伝導方程式シミュレーションに提案隣接集団通信アルゴリズムを適用する実験を行った。また,これらの評価結果やアルゴリズムの特徴,ステンシル計算への適用について考察を行った。(著者抄録)