文献
J-GLOBAL ID:201102267194254640   整理番号:11A1936047

罰と報酬を用いる強化学習の失敗確率の伝播に関する研究

著者 (3件):
資料名:
巻: 54th  ページ: ROMBUNNO.2E103  発行年: 2011年11月19日 
JST資料番号: F0989D  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本報告は罰と報酬を用いる強化学習において,新たに失敗確率の伝播法を提案しその有効性を確認する。学習の効率化を図るためには少ない試行数で罰ルールを発見し回避する事が有効である。そこで,失敗確率をルール上で伝播させる事によって,そのルールの将来失敗する確率を推定し,少ない試行数で罰ルールを発見する手法を提案し,迷路問題を用いたシミュレーションによってその有効性を示す。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
ロボット工学一般 

前のページに戻る