文献
J-GLOBAL ID:202202230940253361   整理番号:22A0917478

強化学習におけるサンプル複雑性の地平依存性の沈降【JST・京大機械翻訳】

Settling the Horizon-Dependence of Sample Complexity in Reinforcement Learning
著者 (3件):
資料名:
巻: 2022  号: FOCS  ページ: 965-976  発行年: 2022年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
最近,強化学習(RL)におけるサンプル複雑性の水平依存性に関心が寄せられている。特に,水平長Hを有するRL環境に対して,以前の研究は,状態および行動の数が固定されているとき,環境相互作用のポリログ(H)エピソードを用いてO(1)最適ポリシーを学習する,おそらく近似的に正しい(PAC)アルゴリズムがあることを示した。ポリログ(H)依存性が必要かどうかは不明である。本研究では,環境相互作用のO(1)エピソードのみを用いて,同じPAC保証を達成するアルゴリズムを開発することにより,この問題を解決し,RLにおけるサンプル複雑性の水平依存性を完全に沈降させた。(i)割引と有限水平Markov決定プロセス(MDP)における値関数と(ii)MDPsにおける新しい摂動解析の間の関係を確立することにより,この境界を達成した。この新技術は独立した興味であり,RLにおける関連質問に適用できると信じる。Copyright 2022 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (5件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  パターン認識  ,  音声処理  ,  符号理論  ,  専用演算制御装置 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る