抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
階層的(H)行列とブロック低ランク(BLR)行列のような低ランク近似法は,計算コストとメモリ利用を低減するために,科学的積分方程式に由来する密な行列を近似できる。分散メモリシステムにおける大量のMPIプロセスの効率的な利用を考慮すると,計算負荷をバランスさせ,MPIプロセッサ間の効率的な通信パターンを構築する必要がある。残念ながら,H行列の複雑な構造は,これらの要求を満たすことを妨げる。マトリックス構造を単純化することはこの問題を解決するための一つの可能なアプローチであり,BLRマトリックス中に見出された格子構造はこのアプローチのための最も便利な構造の一つである。しかし,トレードオフとして,メモリ利用は,O(N log N)を使用するH行列から,O(N ^ 1.5)を用いるBLR行列へと増加する。本研究では,「格子H行列」と呼ばれる新しい方法を提案した。短い格子H行列は,BLR行列で観測された格子構造のブロックにおけるサブ行列としてH行列を利用することにより構成される。格子ブロックをMPIプロセスに割り当てることにより,高密度行列に対する洗練された既存の並列アルゴリズムを利用することができる。格子ブロックサイズを定義し,格子H行列のメモリ複雑性が,MPIプロセッサの数に依存する適切なブロックサイズを用いるとき,O(N log N)のままであることを実証した。したがって,格子H行列はH行列とBLR行列の両方の利点を維持する。分散メモリシステムの大規模問題において,H行列生成やH行列ベクトル乗算などの演算関数における格子H行列の効率を調べた。電場解析の数値実験において,多数のプロセスを用いても格子H行列の場合に比較的良好な負荷バランスが維持されることを確認した。格子H行列の実装は,約4000MPIプロセスの高さに達する並列高速化を示した。格子H行列版の実装は,多数のプロセスに対して通常のH行列版よりも著しく高速であることを確認した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】