情報家電用ヘテロジニアスマルチコア用自動並列化コンパイラフレームワーク

林明宏; 和田康孝; 渡辺岳志; 関口威; 間瀬正啓; 木村啓二; 伊藤雅之; 長谷川淳; 佐藤真琴; 野尻徹; 内山邦男; 笠原博徳

文献

J-GLOBAL ID：201002224602654395 整理番号：10A1156290

情報家電用ヘテロジニアスマルチコア用自動並列化コンパイラフレームワーク

A Compiler Framework for Heterogeneous Multicores for Consumer Electronics

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=10A1156290&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=10A1156290&from=J-GLOBAL&jstjournalNo=Z0031C") }}

著者 (12件)： , , , , , , , , , , ,
資料名：
巻： 2010 号： 3 ページ： ROMBUNNO.ARC-190,NO.7 発行年： 2010年10月15日
JST資料番号： Z0031C ISSN： 2186-2583 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

汎用CPUコアに加え特定処理を高効率で実行可能なアクセラレータを搭載したヘテロジニアスマルチコアが広く普及している。しかしながら,ヘテロジニアスマルチコアでは様々な計算資源へのタスクスケジューリングやデータ転送コード挿入等多くの負担をプログラマが負う必要がある等プログラミングが困難である。そこで本稿では,複数CPU及びアクセラレータを持つヘテロジニアスマルチコアに対して,逐次プログラムを入力とし自動的に実行効率の良い並列プログラムを生成する,ヘテロジニアスマルチコア向け自動並列化コンパイラフレームワークを提案する。本フレームワークでは自動並列化コンパイラとアクセラレータコンパイラとのインターフェースとして新たに提案するヘテロジニアスマルチコア向けOSCAR APIを利用することで,逐次Cプログラムを自動的に汎用コアとアクセラレータコアにタスクを配分し,高い性能を実現する。本手法を情報家電用ヘテロジニアスマルチコアプロセッサRP-Xをターゲットとして,AACエンコーダ及びOptical Flow計算の自動並列化性能を評価した。その結果,8つの汎用CPUコア及び4つのアクセラレータコアを使用した場合,逐次実行時と比較してOptical Flow計算で約12倍(OSCARコンパイラ+アクセラレータコンパイラ使用時),約32倍(OSCARコンパイラ+既存ライブラリ使用時),AACエンコーダで約16倍(OSCARコンパイラ+既存ライブラリ使用時)の性能向上が得られ,ヘテロジニアスマルチコアを対象とした汎用的なコンパイラフレームワークを実現可能であることがわかった。(著者抄録)

, , , , , , , , , ,
, , ,

ディジタル計算機方式一般 , 言語プロセッサ , 家庭電器

, ,

前のページに戻る