文献
J-GLOBAL ID:201802257320637083   整理番号:18A1486154

DTVA:動的なスレッド間ベクトル化アーキテクチャ【JST・京大機械翻訳】

DITVA: Dynamic Inter-Thread Vectorization Architecture
著者 (4件):
資料名:
巻: 120  ページ: 267-281  発行年: 2018年 
JST資料番号: D0613B  ISSN: 0743-7315  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
単一プログラム多重データ(SPMD)プログラミングモデルにおいて,アプリケーションのスレッドは非常に類似した制御フローを示し,しばしば同じ命令を実行するが,異なるデータについて実行する。本論文では,SPMDアプリケーション上のスレッドを横切って存在する暗黙データレベル並列性を活用するために,動的スレッド間ベクトル化アーキテクチャ(DITVA)を提案した。動的ベクトル命令を実行時に組み立てることにより,DITVAは,動的スレッド間ベクトル実行モードを,単一命令,Graphics処理ユニットの多重スレッドモデルに拡張した。このモードでは,ロックステップで走る複数のスカラースレッドが単一命令ストリームを共有し,それぞれの命令インスタンスをSIMD命令に集約する。DITVAは既存のSIMDユニットを活用でき,既存のCPUアーキテクチャと二値互換性を維持することができる。スレッドとデータレベルの並列性をバランスさせるために,スレッドを静的に固定サイズにグループ化する。さらに,動的ベクトル化機会を最大化するために,著者らは,報酬の中でスレッド同期を有利にするために,フェッチステアリングポリシーを適合させて,このように,ロックステップ実行を改善した。PARSECとRodinia OpenMPベンチマークからのSPMDアプリケーションに関するDITVAアーキテクチャの実験評価は,現実的なバンクインタリーブキャッシュを持つ4war×4車線4問題DITVAアーキテクチャが,AVX命令を持つ4スレッド4問題SMTアーキテクチャと比較して1.55倍高い性能を達成し,一方,全体的24%エネルギー削減を達成した。DITVAは,メモリによって制限されたアプリケーションをより高い帯域幅アーキテクチャでスケールすることも可能にする。例えば,帯域幅が2GB/Tから16Gb/sに増加すると,メモリ結合アプリケーションがベースラインSMTと比較して3倍の性能改善を示すことを見出した。したがって,DITVAはSPMD並列セクション上で非常に高い単一コア性能を達成するための費用対効果の高い設計として現れる。Copyright 2018 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
ディジタル計算機方式一般  ,  制御方式 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る