文献
J-GLOBAL ID:202202265162473122   整理番号:22A0986744

部分的可観測性を持つ決定論的強化学習動力学を用いた環境および知覚不確実性の効果のモデル化【JST・京大機械翻訳】

Modeling the effects of environmental and perceptual uncertainty using deterministic reinforcement learning dynamics with partial observability
著者 (3件):
資料名:
巻: 105  号:ページ: 034409  発行年: 2022年 
JST資料番号: W0493A  ISSN: 2470-0045  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
世界の真の状態のエージェントの部分的な観察から生じる不確実性の全身効果のssessingは,ナビゲーションと採餌行動から再生可能資源と公共インフラストラクチャの提供への広範囲のシナリオを理解するために重要である。しかし,エージェント学習と意思決定に関する以前のモデリング作業は,不確実性のこの情報源を記述するための系統的方法を欠いているか,また,実際のエージェントに非現実的に高い認知要求を課す世界の複雑なモデルを使用する最適政策を得ることに焦点を当てる。本研究では,部分的に観察可能な世界に直面した生物学的に妥当で, par観的な学習エージェントの緊急行動を効率的に記述することを目的とした。したがって,エージェントが環境の真の状態を部分的に観測する決定論的強化学習動力学を導き,提示した。部分的に観察可能なエージェント-環境システムの異なるクラスにわたる著者らの動力学の広い適用性を示した。著者らは,部分的可観測性がいくつかの特定の文脈において直感的な利点を生み出して,そのような影響の一般的理解に関する更なる研究への道を指す。例えば,部分観測エージェントは,より安定した方法でより良い結果を迅速に学習することができ,社会的ジレンマを克服する。さらに,著者らの方法は,部分的に観察可能なマルチエージェント希薄化への動的システム理論の適用を可能にする。この点において,著者らは,壊滅的限界サイクルの出現,報酬領域間の学習過程の重要な減速,および学習動力学の,高速および遅い方向への分離,全て部分的観測性に起因することを見出した。したがって,提示した動力学は,生物学,社会科学,および機械学習における研究者にとっての形式的,実用的,軽量かつ堅牢なツールになる可能性を持ち,相互作用のある部分観察エージェントの効果を系統的に調査する。Copyright 2022 The American Physical Society All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 

前のページに戻る