文献
J-GLOBAL ID:201802257568308292   整理番号:18A2036688

GPUのための適応交差近似によるH行列の負荷平衡を意識した並列アルゴリズム【JST・京大機械翻訳】

Load-Balancing-Aware Parallel Algorithms of H-Matrices with Adaptive Cross Approximation for GPUs
著者 (4件):
資料名:
巻: 2018  号: CLUSTER  ページ: 35-45  発行年: 2018年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
階層行列(H行列)は境界要素法(BEM)の係数行列のような高密度行列に対する近似手法である。H行列は,様々なランクを持つ低ランク近似および小密サブ行列の集合により表現される。H行列の使用は,O(N2)からO(NlogN)への高密度行列の必要メモリフットプリントを低減し,従来のCPUと比較して比較的小さいメモリ容量を持つマルチコアプロセッサに適している。しかし,H行列を構築するために使用される低ランク近似アルゴリズムである既存の並列適応交差近似(ACA)アルゴリズムは,負荷分散の観点から多コアプロセッサを利用するように設計されていない。既存の並列アルゴリズムにおいて,ACAプロセスは各サブマトリックスに独立に適用される。各サブマトリックスに対するACAプロセスの計算負荷はサブマトリックスのランクに依存する。しかし,ACAプロセスを適用した後にランクを定義した。これは負荷のバランスをとることを困難にする。著者らは,マルチコアプロセッサに焦点を合わせたH行列のための負荷バランス認識並列ACAアルゴリズムを提案した。提案したアルゴリズムをHACApKに実装した。これはCPUに基づくクラスタのために独自に開発されたオープンソースH行列ライブラリである。提案したアルゴリズムを,NVIDIA Tesla P100GPU(P100)上のBEM問題とIntel Xeon Broadwellプロセッサを用いて評価した。評価結果は,すべてのGPUケースにおいて提案したアルゴリズムの改良性能を実証した。例えば,既存の並列アルゴリズムが負荷をバランスさせることが困難な場合には,提案したアルゴリズムはP100に対して12.9倍の性能改善を達成した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 

前のページに戻る