文献
J-GLOBAL ID:201302235635519160   整理番号:13A1263689

得た経路ガイディング知識に基づく発見強化学習の方法

A Method of Heuristic Reinforcement Learning Based on Acquired Path Guiding Knowledge
著者 (2件):
資料名:
巻: 44  号:ページ: 136-142  発行年: 2012年 
JST資料番号: C2596A  ISSN: 1009-3087  CODEN: SXGKFI  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 中国 (CHN)  言語: 中国語 (ZH)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
補強材料学習アルゴリズムの効率と収束性速度を改良するために,得た経路ガイディング知識(PHQL)に基づく発見強化学習の方法を提案した。PHQLを使用する学習プロセスの間,組込バックグラウンド知識が因子に必要でなかった。因子が各々の出来事においてQテーブルを更新する間,経路知識はさらに構築して修正して,独立して最適化した。その後,学習プロセスは,得た経路知識の手段よって導いて速めた。それは因子の愚かさを減少した。加えて,調査の3種類の活動選択方法,功績と発見を解析して,そのうえ,活動選択可能性が時間とともに変えた実際的方法を提唱した。経路計画環境において,PHQLは標準Q-学習と他の関連した強化学習アルゴリズムと比較した。実験結果は,現在の方法が明らかに,学習プロセスを速めて,明確に収束性速度を改良することを示した。Data from the ScienceChina, LCAS. Translated by JST
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
数値計算 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る