文献
J-GLOBAL ID:200902263830659636   整理番号:08A0565213

NVIDIA TESLA:グラフィックス/コンピューティング統合化アーキテクチャ

NVIDIA TESLA: A UNIFIED GRAPHICS AND COMPUTING ARCHITECTURE
著者 (4件):
資料名:
巻: 28  号:ページ: 39-55  発行年: 2008年03月 
JST資料番号: H0837A  ISSN: 0272-1732  資料種別: 逐次刊行物 (A)
記事区分: 解説  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
従来,頂点プロセッサと画素プロセッサは要求条件の違いもあって別々に発展してきた。一般に画素処理量の方は頂点処理量よりも大きいけれども,常にうまく負荷のバランスを保ち得るわけではない。NVIDIAのTeslaアーキテクチャはこの両処理を統合し,C言語で書かれた高性能並列処理アプリケーションが使えるようにした。このアーキテクチャはスケーラブルなプロセッサアレイを用いる。GeForce 8800 GPUの例では128個のストリーミングプロセッサ(SP)が各々8個のユニットを含む16個のストリーミングマルチプロセッサ(SM)に区分される。SMは2個ずつ組になって1個のテクスチャ/プロセッサクラスタ(TPC)をなす。入力アセンブラは入力コマンドストリームから頂点ワークを集めて各TPCへパケットを送る。TPCは頂点シェイダープログラムを実行し,出力はオンチップバッファに蓄えられる。同様に画素ワークが適切なTPCに送られ処理が行われる。GPUのホストインターフェースはホストCPUと通信し,コマンドに応答してシステムメモリからデータを読み出す。入力アセンブラは図形データを集め,関連する頂点情報を呼び出す。Geforce 8800 UltraではSPのクロックは1.5GHzであり,最大スループットは36Gflops/SMである。省電力のため非データパスユニットはSPクロックの半分で動作する。SMでは新しい制御方式SIMT(単一命令複数スレッド)を用いる。ワープ(warp)と呼ばれる32並列スレッドを単位として管理する。各SMは24ワープを管理しスレッドの数は合計768となる。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
汎用演算制御装置 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る