抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自動車制御のようなリアルタイム制御システムの開発では,デッドラインを厳密に守るために各コアがローカルメモリを持つマルチコアの利用が必要となる。容量制限のあるローカルメモリをプログラマが手動で管理することは極めて困難であることから,コンパイラによって自動的にローカルメモリの管理を行う手法の開発が望まれている。従来の並列化コンパイラではローカルメモリの自動管理ができるものはなかった。各コアのローカルメモリにデータを転送し,そのデータを可能な限り再利用して高速化を目指すことが効率的な並列化では重要である。このためにはプログラムで使用される配列データをローカルメモリに載るサイズに分割し,プログラム各部でのワーキングセットがローカルメモリに配置され,さらにローカルメモリ上のデータを複数のループ等で再利用するという処理が望まれる。このデータの分割においては多次元配列の場合最外側のループを分割する方法が考えられるが,ローカルメモリサイズが小さい場合さらに内側のネストループにわたって分割することでよりデータサイズを縮小することが必要となる。本稿ではこのようなデータ多次元整合分割と分割したデータをローカルメモリの領域に割り当てる方式,さらに分割数が増大した時に発生しうるコードサイズ増大の問題を解消するコードコンパクションのためのストリップマイニング手法を提案する。本手法の性能評価を32KBのローカルメモリを搭載したSH4Aを8コア集積したマルチコアプロセッサRP2上で行ったところ,SPEC95swimにおいて逐次実行に比べて8PE時に11.3倍の性能向上を得ることに成功した。(著者抄録)