強化学習スパースインセンティブアルゴリズム研究-理論と実験【JST・京大機械翻訳】

Yang Rui; Yan Jiangpeng; Li Xiu

文献

J-GLOBAL ID：202102216316836921 整理番号：21A1171100

強化学習スパースインセンティブアルゴリズム研究-理論と実験【JST・京大機械翻訳】

Survey of sparse reward algorithms in reinforcement learning-theory and experiment

出版者サイト複写サービスで全文入手
高度な検索・分析はJDreamⅢで

著者 (3件)： , ,
資料名：
巻： 15 号： 5 ページ： 888-899 発行年： 2020年
JST資料番号： C2755A ISSN： 1673-4785 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：中国 (CHN) 言語：中国語 (ZH)

ここ数年来、強化学習はゲーム、ロボット制御などの序列決定領域で巨大な成功を得ているが、大量の実際問題の中では信号が非常にスパースであり、知能体は環境との対話から最適の策略を学習することが難しいため、この問題はスパースインセンティブ問題と呼ばれている。スパースインセンティブ問題の研究は,強化学習の実際の応用と着地を促進でき,強化学習理論研究において重要な意味を持つ。本文では、スパースインセンティブ問題の研究現状について調査し、外部誘導情報を手がかりとして、それぞれ、インセンティブモデリング、模倣学習、カリキュラム学習、事後経験の再生、好奇心駆動、階層強化学習などの方法を紹介した。本論文では、スパースインセンティブ環境FetchReach上で以上の6種類の方法の代表的なアルゴリズムを実現し、実験検証と比較分析を行った。外部誘導情報を用いたアルゴリズムは,外部誘導情報のないアルゴリズムよりも平均的に表現されるが,後者がデータへの依存性が低く,2つの方法が重要な研究意味を持つ。最後に,スパースインセンティブアルゴリズムの研究を要約し,展望した。Data from Wanfang. Translated by JST.【JST・京大機械翻訳】

, , , ,
, , , , , 【Automatic Indexing@JST】

人工知能

, , ,

前のページに戻る