文献
J-GLOBAL ID:201902286373547084   整理番号:19A0148217

行動系列分割に基づく不完全なエキスパートからの逆強化学習

著者 (3件):
資料名:
巻: 2018  ページ: ROMBUNNO.SS0804  発行年: 2018年11月25日 
JST資料番号: F0428D  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
逆強化学習はエキスパートの行動を基に,エキスパートを正しいものとして模倣するような行動を獲得するための報酬を推定する。そのため環境変化などによりエキスパートが誤った行動をしている場合に,新たな環境に適したエキスパートを設定する必要がある。解決策の一つとしてエキスパートの誤った部分の学習を避けることが考えられ,その場合エキスパートの行動系列を分割して学習する必要がある。そこで本研究では,エキスパートの一連の行動系列を分割して学習する逆強化学習を提案する。迷路問題を例題として,提案手法により報酬関数の獲得が可能であることを確認した。また獲得した報酬関数による強化学習では,学習速度に関して従来手法と同等の性能を有し,最終的に獲得した方策が報酬和が最大かつ最短ステップ数の行動経路を取るものであることが確認できた。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る