異種マルチコアアーキテクチャにおけるストリーミング並列性の最適化:機械学習ベースアプローチ【JST・京大機械翻訳】

Zhang Peng; Fang Jianbin; Yang Canqun; Huang Chun; Tang Tao; Wang Zheng

プレプリント

J-GLOBAL ID：202202210582883806 整理番号：22P0121076

異種マルチコアアーキテクチャにおけるストリーミング並列性の最適化:機械学習ベースアプローチ【JST・京大機械翻訳】

Optimizing Streaming Parallelism on Heterogeneous Many-Core Architectures: A Machine Learning Based Approach

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (6件)： , , , , ,
資料名：
発行年： 2020年03月05日プレプリントサーバーでの情報更新日： 2020年03月05日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。

本論文では,不均一多コアアーキテクチャ上のタスクベース並列アプリケーションのためのハードウェア資源分割とタスク粒度に対する良好な解を迅速に導出するための自動アプローチを提案した。本アプローチは,与えられた資源分割とタスク粒度構成の下で,目標アプリケーションの結果として生じる性能を推定するために,性能モデルを採用する。モデルは,ランタイムで良好な構成を迅速に探索するための有用性として使用された。低レベルハードウェアの詳細に専門家の洞察を必要とする解析モデルを手作業する代わりに,機械学習技術を用いて自動的に学習する。訓練プログラムを用いて予測モデルをオフラインで学習することによりこれを達成した。次に,学習モデルを,実行時で任意の非意味プログラムの性能を予測するために使用できる。このアプローチを39の代表的な並列アプリケーションに適用し,2つの代表的な不均一多コアプラットフォーム(CPU-XeonPhiプラットフォームとCPU-GPUプラットフォーム)で評価した。単一ストリームバージョンと比較して,この手法は,平均で,キセノンPhiとGPUプラットフォームでそれぞれ1.6xと1.1x高速化を達成した。これらの結果は,理論的に完全な予測器によってもたらされる性能の93%以上を変換する。【JST・京大機械翻訳】

, , , , , , , , ,
, , , , , , 【Automatic Indexing@JST】

計算機システム開発 , ディジタル計算機方式一般 , 人工知能

, , ,

前のページに戻る