文献
J-GLOBAL ID:201502261412008577   整理番号:15A0649498

QR分解に対する通信回避型アルゴリズムと自動チューニング

著者 (2件):
資料名:
巻: 20  号:ページ: 3247-3250  発行年: 2015年04月30日 
JST資料番号: L5669A  ISSN: 1341-7622  資料種別: 逐次刊行物 (A)
記事区分: 解説  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
エクサスケールのスーパーコンピュータの開発がスタートし,大規模並列計算機での通信時間の削減が重要な課題となっている。本論文では,京コンピュータ上でMPI_Allreduceを実行した場合の性能を例に,超並列環境でボトルネックとなる通信時間を削減するために,通信回避によるレイテンシ削減が効果的なことを説明した。次に,最小二乗問題の求解を始めとする様々な場面で用いられる縦長行列のQR分解を題材とし,問題の難しさに依存せずに数値的に安定なハウスホルダーQR分解に対する通信回避型アルゴリズムを紹介した。TSQRアルゴリズムは各プロセスが部分行列のQR分解を独立に計算し,得られた上三角行列を隣のプロセスに1対1通信して,2つの上三角行列からなる小サイズの行列のQR分解によって1つの上三角行列にする操作を繰り返すことで,通信時間を大幅に削減できる。また,行列積が中心でTSQRアルゴリズムよりも高性能なコレスキーQR分解では行列の条件数が大きくなると,それに応じて計算精度が悪化するので,著者らは以前にコレスキーQR分解を2回繰り返すアルゴリズムCholeskyQR2を提案した。実際に108程度の条件数までは安定であり,京コンピュータ上でTSQRアルゴリズムよりも高性能なことが確かめられており,異なる通信回避アルゴリズムの使い分けが課題であることを示した。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
ディジタル計算機方式一般  ,  数値計算  ,  電話・データ通信・交換一般 
引用文献 (13件):
  • LAPACK Working Notes, http://www.netlib.org/lapack/lawns/downloads/
  • BeBOP, http://bebop.cs.berkeley.edu/
  • J. Demmel, http://www.cs.berkeley.edu/~demmel/
  • G. Ballard, et al., Minimizing communication in linear algebra, SIAM J. Matrix Anal. Appl., Vol.32, No.3, pp.866-901 (2011).
  • J. Demmel, et al., Communication-optimal parallel and sequential QR and LU factorizations, SIAM J. Sci. Comput., Vol.34, No.1, pp.206-239 (2012).
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る