文献
J-GLOBAL ID:200902232981849833   整理番号:08A0800840

図形処理装置上の高速多重極法

Fast multipole methods on graphics processors
著者 (4件):
資料名:
巻: 227  号: 18  ページ: 8290-8313  発行年: 2008年09月10日 
JST資料番号: B0860A  ISSN: 0021-9991  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
高速多重極法(FMM)は動径基底関数の和に対する高速近似計算を可能にする。指定された精度εに対しこの方法は,計算量O(N2)を持つ直接法とは異なり,時間およびメモリの両方でO(N)とスケールする。これにより与えられたリソースで膨大な問題を解くことができる。図形処理装置(GPU)は今や,低価格で優れた計算能力を持つデータ並列計算コプロセッサと見なされるに至った。ここではデータ並列GPUアーキテクチァを用いるFMMの加速を述べた。FMMは複雑な階層(適応)構造を持ち,データ並列プロセッサ上で容易には実現できない。FMMのすべての成分を並列化するための戦略を述べ,GPUアーキテクチァ上でアルゴリズムの実行を説明するためのモデルを開発し,GPU上のFMMに対する最適設定を決定した。これらの最適設定は通常のCPUの場合と異なっている。変形ステンシルの利用やLaplace核に対する実多項式の基底関数,並進演算子の分解などを含む,FMMアルゴリズムにおけるいくつかの新機軸を述べた。単独NVIDIA GeForce 8800GTX GPU上で,直列CPU FMM実行に比べて30~60倍の範囲にある,Laplace核FMMの加速を得た。百万個の源を持つ問題に対して総和を約1秒で実行した。この性能は,正攻法の総和を用いたときの同じ問題を43テラフロップで解くことに相当する。Copyright 2008 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
応用プログラミング言語  ,  数値計算 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る