文献
J-GLOBAL ID:200902233720104950   整理番号:09A0419907

グリッドベース地図誤差に基づく好奇心を内部報酬とする強化学習

Reinforcement Learning with Internal Rewards Based on Error in a Grid-based Map
著者 (2件):
資料名:
巻: 108  号: 480(NC2008 103-175)  ページ: 285-290  発行年: 2009年03月04日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ゴールまでの最適行動を強化学習によって求めるという課題に対し,ゴール到達時の環境からの外部報酬に加えて,好奇心を内部報酬とすることにより,強化学習を効率化することを目的とする。ここで予測誤差の減少により好奇心を定義し,センサー情報から推定したグリッドベース地図と,各グリッドでのセンサー情報との差を予測誤差と定義する。シミュレーション実験の結果,強化学習と比較して過渡状態におけるゴール回数や行動回数に関して性能の向上が見られた。併せて,提案手法で用いた各パラメータ値が行動獲得や環境学習に与える影響についても検討した。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
引用文献 (4件):

前のページに戻る