抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ターゲット強化学習(RL)タスクからのサンプルおよび異なるが関連するRLタスクからのソースサンプルを用いて,知識転送によるQ学習を考察した。オフラインソース研究によるバッチとオンラインQ学習の両方に対する転送学習アルゴリズムを提案した。提案した転送Q学習アルゴリズムは,教師つき学習のための転送学習(TL)として,通常の水平情報収集に加えて,RLタスクにおける多重ステップに沿った垂直情報カスケードを可能にする新しい再ターゲットステップを含む。オフラインRL転送におけるQ関数推定の収束の速い速度,およびある類似性仮定の下でのオフラインからオンラインへのRL移動におけるより低いレグレット結合を示すことにより,RLタスクにおけるTLの最初の理論的正当化を確立した。合成および実データセットの両方からの経験的証拠を提示し,提案アルゴリズムおよび理論的結果をバックアップした。【JST・京大機械翻訳】