文献
J-GLOBAL ID:202202233085843699   整理番号:22A0853492

補助報酬システムによる強化学習と逆強化学習の融合【JST・京大機械翻訳】

Merging Reinforcement Learning and Inverse Reinforcement Learning via Auxiliary Reward System
著者 (2件):
資料名:
巻: 2022  号: ICAIIC  ページ: 292-297  発行年: 2022年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,実証からの学習はロボット工学と対話型システムにおける有望な方法の1つになった。実証からの学習は,エージェントがエキスパートを観察することによって学習するモデルであった。専門家は前訓練されたエージェントまたは人間である。実証からの学習による主な問題は,実証における報酬表現と実際の環境の間の差異である。実証の構築の間,エージェントの性能を強化する新しい報酬を追加することは容易である。対照的に,実際の環境においては容易ではない。本研究は,この問題を解決するための以前の研究で構築する。これまでの研究では,エージェントは,デモンストレーションからビデオゲームを演ずる方法を学習するために,強化学習アルゴリズムを使用する。エージェントは,ハード探査環境における欠落報酬の問題を解決するために,外部報酬によって供給した。本研究では,逆強化学習を用いて,実証から外部報酬を抽出し,相互作用期間中に利用できる。結果は,逆学習が事前訓練の後,エージェントを環境と相互作用することができることを示した。さらに,エージェントの性能はより安定になった。Copyright 2022 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る