NVIDIA TESLA:グラフィックス/コンピューティング統合化アーキテクチャ

LINDHOLM Erik; NICKOLLS John; OBERMAN Stuart; MONTRYM John

文献

J-GLOBAL ID：200902263830659636 整理番号：08A0565213

NVIDIA TESLA:グラフィックス/コンピューティング統合化アーキテクチャ

NVIDIA TESLA: A UNIFIED GRAPHICS AND COMPUTING ARCHITECTURE

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=08A0565213&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=08A0565213&from=J-GLOBAL&jstjournalNo=H0837A") }}

著者 (4件)： , , ,
資料名：
巻： 28 号： 2 ページ： 39-55 発行年： 2008年03月
JST資料番号： H0837A ISSN： 0272-1732 資料種別：逐次刊行物 (A)
記事区分：解説発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

従来,頂点プロセッサと画素プロセッサは要求条件の違いもあって別々に発展してきた。一般に画素処理量の方は頂点処理量よりも大きいけれども,常にうまく負荷のバランスを保ち得るわけではない。NVIDIAのTeslaアーキテクチャはこの両処理を統合し,C言語で書かれた高性能並列処理アプリケーションが使えるようにした。このアーキテクチャはスケーラブルなプロセッサアレイを用いる。GeForce 8800 GPUの例では128個のストリーミングプロセッサ(SP)が各々8個のユニットを含む16個のストリーミングマルチプロセッサ(SM)に区分される。SMは2個ずつ組になって1個のテクスチャ/プロセッサクラスタ(TPC)をなす。入力アセンブラは入力コマンドストリームから頂点ワークを集めて各TPCへパケットを送る。TPCは頂点シェイダープログラムを実行し,出力はオンチップバッファに蓄えられる。同様に画素ワークが適切なTPCに送られ処理が行われる。GPUのホストインターフェースはホストCPUと通信し,コマンドに応答してシステムメモリからデータを読み出す。入力アセンブラは図形データを集め,関連する頂点情報を呼び出す。Geforce 8800 UltraではSPのクロックは1.5GHzであり,最大スループットは36Gflops/SMである。省電力のため非データパスユニットはSPクロックの半分で動作する。SMでは新しい制御方式SIMT(単一命令複数スレッド)を用いる。ワープ(warp)と呼ばれる32並列スレッドを単位として管理する。各SMは24ワープを管理しスレッドの数は合計768となる。

, , , ,

汎用演算制御装置

, , ,

前のページに戻る