抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
リアルタイム性および高性能,低電力が要求される情報家電機器では,オフチップ共有メモリに加え,小容量高速なローカルメモリを搭載したマルチコアプロセッサが開発されている。しかしながら,プログラマが手動でローカルメモリ容量を考慮しつつローカリティの最適化を行うことはきわめて困難であり,プログラム開発期間の短縮のためにはコンパイラによる自動最適化が必要となる。そこで,本論文では,容量制約のあるローカルメモリを有効に利用するための並列化コンパイル手法を提案する。提案手法ではまず,粗粒度タスク並列処理によりループやサブルーチン間の並列性を抽出する。続いてループ整合分割により,ローカルメモリサイズを考慮した粗粒度タスク分割を行う。従来のデータローカライゼーション手法は,分割されたデータを固定的にローカルメモリに割り当てていた。提案手法では,タスク分割後,データの定義あるいは参照時刻に基づくローカルメモリの割当てと解放を行い,より柔軟なローカルメモリ管理を実現する。オーディオ圧縮に用いられるAACエンコーダを用いた性能評価の結果,固定的な割当てを行う従来のデータローカライゼーション手法と比較し,SH4Aを4コア集積したRP1マルチコア上で,約2.6倍,8コア集積したRP2マルチコア上で,約2.5倍の速度向上がそれぞれ得られた。(著者抄録)