抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自動車におけるハードリアルタイム制御のようにデッドラインを確実に守らなければならないプログラムでは,キャッシュメモリの使用は困難であり,各コアがローカルメモリを持つマルチコアが利用されている。ローカルメモリは小容量であるため,その有効利用のためには配置するデータの選択,データ再利用のためのループ分割,ローカルメモリ上におけるデータの割り当て領域の決定,データ転送の挿入など複雑な管理が必要となり,これをプログラマが手動で管理することは極めて困難である。特に,ローカルメモリ管理対象となる配列はアプリケーションによってさまざまな次元やサイズを持つため,これらのデータをローカルメモリに割り当てる際には共有メモリとローカルメモリ間のデータ転送単位であるブロックサイズを適切に選び,ローカルメモリの効率的な利用が出来るようにする必要がある。そのため本稿ではコンパイラを用いた自動的なローカルメモリ管理,およびその中でもアプリケーションに応じてブロックサイズがソフトウェアコンパイル時に決定され,さらに各ブロックを整数分の1に分割して使用できる階層アジャスタブルブロックにローカルメモリを区切り割り当て領域を決定する手法を提案する。本手法の性能評価を32KBのローカルメモリを搭載したSH4Aを8コア集積したマルチコアプロセッサRP2上で行ったところ,Nas Parallel BenchmarksのプログラムBTにおいて共有メモリを用いた逐次実行に比べて4PE時に5.76倍の性能向上を得ることに成功した。(著者抄録)