プレプリント
J-GLOBAL ID:202202218851944931   整理番号:22P0297952

Regretベース環境設計によるカリキュラムの進化【JST・京大機械翻訳】

Evolving Curricula with Regret-Based Environment Design
著者 (7件):
資料名:
発行年: 2022年03月02日  プレプリントサーバーでの情報更新日: 2023年09月30日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
それは,強化学習(RL)で一般に可能なエージェントを訓練する大きな挑戦である。RLエージェントのロバスト性を改善する有望な手段は,カリキュラムの使用である。そのようなクラスの方法は,学生と教師の間のゲームとして環境設計を,学生エージェントの能力のフロンティアで環境インスタンス化(またはレベル)を作り出すために,レグレットベースの目的を用いて行う。これらの方法は,その普遍性から利益を得て,平衡における理論的保証を有するが,それらはしばしば困難な設計空間において有効レベルを見つけるのにしばしば苦労する。対照的に,進化的アプローチは,環境複雑性を漸増的に変更し,潜在的にオープンエンド学習をもたらすが,しばしばドメイン固有の発見的および大量の計算資源に依存する。本論文では,原理的,レギットベースのカリキュラムにおける進化の電力を利用することを提案する。このアプローチでは,Editingレベル(ACCEL)による敵対的合成複雑性を呼び出し,エージェントの能力のフロンティアでレベルを常に生産し,単純だがますます複雑になるカリキュラムをもたらす。ACCELは,事前のレグレットベースの方法の理論的利点を維持し,一方,多様な環境セットで重要な経験的利得を提供する。論文のインタラクティブバージョンは,accelエージェント.github.ioで利用可能である。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る