文献
J-GLOBAL ID:202002236290068612   整理番号:20A2571946

強化学習エージェントの挙動の理解【JST・京大機械翻訳】

Understanding the Behavior of Reinforcement Learning Agents
著者 (4件):
資料名:
巻: 12438  ページ: 148-160  発行年: 2020年 
JST資料番号: H0078D  ISSN: 0302-9743  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習(RL)は,報酬の測度に基づいて,特定のタスクを解決するための訓練エージェントのプロセスである。その環境におけるエージェントの挙動を理解することは重要である。例えば,ユーザが特定のエージェントがタスクで失敗する理由を理解するならば,それらは,正しい方向におけるエージェントの開発を操縦するために,より良い報酬関数を定義することができる。また,アンダースタンダビリティはエージェント展開のための決定を起す。自律車の制御装置が特定の交通状況において失敗するか,または優れているかを知るならば,著者らは,実際にそれらを使用するかどうかに関して,より良い決定をすることができた。RLの理解可能性を容易にすることを目的とした。そのために,行動空間を調べ,一連の入力状態に対して観測されたエージェントの行動のセットを調べた。ここでは,その空間における距離または類似性の測度を開発し,エージェントがそれらの挙動においてどのように比較するかを解析した。さらに,どの状態と行動がタスクに対して重要であるかを検討し,報酬と行動の間の相関を決定する。2つの基本的なRL環境を利用して,著者らの対策を調査した。結果は,エージェントの挙動を調べ,挙動空間におけるそれらの距離を比較する高いポテンシャルを示した。Copyright Springer Nature Switzerland AG 2020 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る