抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
アクセラレータで計算を高速に行うためには高いデータ供給能力が重要となる。しかしながら,流体計算や構造計算などでよく利用される疎行列計算では,配列間接参照によるメモリのランダムアクセスが発生し,データ供給能力が低下してしまう。さらに,アクセラレータに対して配列間接参照を行うための非効率的なプログラム処理,あるいは複雑なメモリアクセス機構が要求される。本稿では,ローカルメモリからアクセラレータへデータを供給する構成を前提とし,主記憶から配列間接参照によりローカルメモリ上の連続領域にデータを転送する,カスケード接続されたDMA構成を提案する。本DMA構成により,アクセラレータのメモリアクセス機構をシンプルに保ったまま効率の良い配列間接参照が可能となる。本DMA構成をFPGAにより実装し,疎行列-密ベクトル積を用いて評価を行った。評価の結果,同じくFPGA上に実装されたスカラプロセッサと比較し,提案手法とベクトルプロセッサを組み合わせたシステムで最大12.1倍の性能を得られた。(著者抄録)