抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
従来,頂点プロセッサと画素プロセッサは要求条件の違いもあって別々に発展してきた。一般に画素処理量の方は頂点処理量よりも大きいけれども,常にうまく負荷のバランスを保ち得るわけではない。NVIDIAのTeslaアーキテクチャはこの両処理を統合し,C言語で書かれた高性能並列処理アプリケーションが使えるようにした。このアーキテクチャはスケーラブルなプロセッサアレイを用いる。GeForce 8800 GPUの例では128個のストリーミングプロセッサ(SP)が各々8個のユニットを含む16個のストリーミングマルチプロセッサ(SM)に区分される。SMは2個ずつ組になって1個のテクスチャ/プロセッサクラスタ(TPC)をなす。入力アセンブラは入力コマンドストリームから頂点ワークを集めて各TPCへパケットを送る。TPCは頂点シェイダープログラムを実行し,出力はオンチップバッファに蓄えられる。同様に画素ワークが適切なTPCに送られ処理が行われる。GPUのホストインターフェースはホストCPUと通信し,コマンドに応答してシステムメモリからデータを読み出す。入力アセンブラは図形データを集め,関連する頂点情報を呼び出す。Geforce 8800 UltraではSPのクロックは1.5GHzであり,最大スループットは36Gflops/SMである。省電力のため非データパスユニットはSPクロックの半分で動作する。SMでは新しい制御方式SIMT(単一命令複数スレッド)を用いる。ワープ(warp)と呼ばれる32並列スレッドを単位として管理する。各SMは24ワープを管理しスレッドの数は合計768となる。