抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
組込み向けシステム開発には,MATLAB/Simulinkのようなツールが幅広く利用されており,設計から実装・検証を一貫して行うことができる.このような開発では,Embedded CoderやMATLAB Coderのような組み込みシステム上に実装する自動Cコード生成がサポートされているが,マルチコアプロセッサによる並列処理を十分に活用できていない.従来までに,Simulinkモデル内のブロック間並列性を抽出する手法が提案されているが,ブロック内部の並列性やMATLAB言語で記述されたカスタムブロック内の並列性を抽出していない.これに対して,MATLAB/Simulinkから自動生成されたCコードに対して,モデル内のブロック間並列性やブロック内部のループ並列性を抽出するOSCAR自動並列化コンパイラを用いたマルチグレイン並列化手法が提案されている.しかしながら,コードレベルでの並列化ではコンパイラの解析機能に依存し,自動生成されたコード特有の冗長的な構造により,コンパイラによる解析が難しい場合が存在した.そこで,従来のOSCAR自動並列化コンパイラの解析機能に加えて,シンボリック伝搬とループインターチェンジ及び動的メモリ確保解析機能を拡張し,より多くのアプリケーションで自動並列化可能にした.本稿ではOSCAR自動並列化コンパイラによりMATLAB/Simulinkアプリケーションを並列化した結果,Intel Xeon X5670での4コア実行時,画像勾配計算では1.88倍,二次元台座エッジの抽出では1.79倍,時系列データの移動平均計算では5.04倍の速度向上が得られた.またPSNRでは3.62倍の速度向上が得られた.さらに画像回転では2.63倍,緑色検出では3.48倍の速度向上が得られた.同様に,上記のアプリケーションに対してCortex-A72を4コア持つRaspberry Pi4上での速度向上を確認した.これらの結果からOSCAR自動並列化コンパイラによるMATLAB/Simulinkアプリケーションの並列性抽出が有効であることを確認した.(著者抄録)