伝達Q学習【JST・京大機械翻訳】

Chen Elynn Y.; Jordan Michael I.; Li Sai

プレプリント

J-GLOBAL ID：202202216288226676 整理番号：22P0287321

伝達Q学習【JST・京大機械翻訳】

Transferred Q-learning

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年02月09日プレプリントサーバーでの情報更新日： 2022年02月09日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

ターゲット強化学習(RL)タスクからのサンプルおよび異なるが関連するRLタスクからのソースサンプルを用いて,知識転送によるQ学習を考察した。オフラインソース研究によるバッチとオンラインQ学習の両方に対する転送学習アルゴリズムを提案した。提案した転送Q学習アルゴリズムは,教師つき学習のための転送学習(TL)として,通常の水平情報収集に加えて,RLタスクにおける多重ステップに沿った垂直情報カスケードを可能にする新しい再ターゲットステップを含む。オフラインRL転送におけるQ関数推定の収束の速い速度,およびある類似性仮定の下でのオフラインからオンラインへのRL移動におけるより低いレグレット結合を示すことにより,RLタスクにおけるTLの最初の理論的正当化を確立した。合成および実データセットの両方からの経験的証拠を提示し,提案アルゴリズムおよび理論的結果をバックアップした。【JST・京大機械翻訳】

, , , , , , , ,
, , , , 【Automatic Indexing@JST】

人工知能

前のページに戻る