文献
J-GLOBAL ID:201302215943502588   整理番号:13A0160790

強化学習の最近の発展《第1回》強化学習の基礎

著者 (1件):
資料名:
巻: 52  号:ページ: 72-77  発行年: 2013年01月10日 
JST資料番号: F0131A  ISSN: 0453-4662  CODEN: KESEA  資料種別: 逐次刊行物 (A)
記事区分: 文献レビュー  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習とは,試行錯誤を通じて環境に適応する学習制御の枠組みである。教師付き学習と異なり,状態入力に対する正しい行動出力を明示的に示す教師が存在しない代わりに,一連の行動に対して結果としての良し悪しを評価する「報酬」というスカラーの評価値が与えられ,これを手がかりに学習を行うが,報酬や状態遷移には不確実性や時間的遅れがあるので,一般に行動を実行した直後の報酬をみるだけでは,学習主体はその行動の正否を判断できないという困難を伴う。強化学習では,環境のダイナミクスをマルコフ決定過程(MDP)によってモデル化し,学習アルゴリズムを解析するのが一般的である。本解説では,MDPモデルおよび代表的な強化学習法として知られるActor Critic法とQ学習を中心に理論的な基礎について解説する。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
システム設計・解析  ,  人工知能 
引用文献 (7件):
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る