抄録/ポイント: 抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文ではGPGPU向けの統合開発環境CUDAを用いた,正方行列の特異値分解の高速化について報告する。正方行列の特異値分解では,計算対象の行列を二重対角行列に変換してから特異値分解を行い,その後逆変換を行うことで,もとの行列の特異値分解を得る。本論文ではCUDAのBLASライブラリ(CUBLAS)の中の高性能なSGEMM(行列乗算ルーチン)を効率的に利用することで,比較的少ないコストで大幅な高速化を行うことを目指し,演算の大部分がBLASによって行われる二重対角化と逆変換部分をGPUを用いて高速化した。実装にあたっては,行列乗算を中心に二重対角化が可能なBischofの手法がGPU向けに適していることを簡単な性能予測を通して確認し,この手法を採用した。また,各計算ステップにおけるCPUとGPUとの仕事の適切な分担や計算のオーバラップについても考慮した。GPUとしてNVIDIAのGeForce8800GTXを用いた性能評価の結果,CPU(Intel Core2Duo1.86GHz2コア使用)のみで計算する場合と比べて,5,120次元の正方行列の特異値分解の計算が約4倍高速化できることを確認した。(著者抄録)