文献
J-GLOBAL ID:202002229785296483   整理番号:20A1508702

ボルタGPUにおける重力八分木コード性能評価【JST・京大機械翻訳】

Gravitational Octree Code Performance Evaluation on Volta GPU
著者 (1件):
資料名:
号: ICPP 2019  ページ: 1-10  発行年: 2019年 
JST資料番号: D0698C  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本研究では,Fermi,Kepler,およびMaxwell GPUアーキテクチャのために最初に最適化された重力オクトツリーコードをVoltaアーキテクチャに適応した。Voltaアーキテクチャは,適切な位置における明示的同期の挿入,または,-ゲンコードアーチ=計算60,符号=sm_70を指定することによって,Pascalまたは以前のアーキテクチャと同じ陰的同期の取締りのいずれかを必要とする独立スレッドスケジューリングを導入する。Tesla V100に関する性能測定,NVIDIAによる現在のフラグシップGPUは,223=8388608粒子を有するAndromeda銀河モデルのN-体シミュレーションが,陰的同期有り無しの場合に対して,それぞれ,3.8×10-2sまたは3.3×10-2s/ステップであったことを明らかにした。Tesla V100は,Tesla P100と比較して1.4から2.2倍の加速を達成し,以前の世代における flag艦GPUである。2.2の観察されたスピードアップは1.5より大きく,それは2つのGPUの理論的ピーク性能の比率である。浮動小数操作のためのそれらからの整数演算のためのユニットの独立性は,整数と浮動点数操作の重複実行を可能にした。それは,理論的ピーク性能比以上のスピードアップ速度をもたらす整数演算の実行時間を隠す。Tesla V100は25×220=26214400粒子までN-体シミュレーションを実行でき,1ステップ当たり2.0×10-1sを要した。それは,単一精度理論ピーク性能の22%である3.5TFlop/sに対応する。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
専用演算制御装置 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る