抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
エクサスケールのスーパーコンピュータの開発がスタートし,大規模並列計算機での通信時間の削減が重要な課題となっている。本論文では,京コンピュータ上でMPI_Allreduceを実行した場合の性能を例に,超並列環境でボトルネックとなる通信時間を削減するために,通信回避によるレイテンシ削減が効果的なことを説明した。次に,最小二乗問題の求解を始めとする様々な場面で用いられる縦長行列のQR分解を題材とし,問題の難しさに依存せずに数値的に安定なハウスホルダーQR分解に対する通信回避型アルゴリズムを紹介した。TSQRアルゴリズムは各プロセスが部分行列のQR分解を独立に計算し,得られた上三角行列を隣のプロセスに1対1通信して,2つの上三角行列からなる小サイズの行列のQR分解によって1つの上三角行列にする操作を繰り返すことで,通信時間を大幅に削減できる。また,行列積が中心でTSQRアルゴリズムよりも高性能なコレスキーQR分解では行列の条件数が大きくなると,それに応じて計算精度が悪化するので,著者らは以前にコレスキーQR分解を2回繰り返すアルゴリズムCholeskyQR2を提案した。実際に10
8程度の条件数までは安定であり,京コンピュータ上でTSQRアルゴリズムよりも高性能なことが確かめられており,異なる通信回避アルゴリズムの使い分けが課題であることを示した。