文献
J-GLOBAL ID:202202285680503472   整理番号:22A0496812

見えない状況における強化学習エージェントをガイドするためのオントロジーの利用:交通信号制御システムの事例研究【JST・京大機械翻訳】

Using ontology to guide reinforcement learning agents in unseen situations A traffic signal control system case study
著者 (2件):
資料名:
巻: 52  号:ページ: 1808-1824  発行年: 2022年 
JST資料番号: W0297A  ISSN: 0924-669X  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
マルチエージェントシステムにおいては,エージェントが絶えず変化する環境および顔の不調な状況で動作するとき,目標達成は挑戦的であり,そこでは,すべての目標が既知または定義されていない。そのような場合,エージェントは,それらの目標を進化させ,また,新たな要求に対処する新しい目標を作り出すことにより,その変化を同定し,それらの行動を適応させる必要がある。学習と実用的推論技法を用いて,新しい環境に適応するための限られた知識を持つエージェントを可能にした。しかし,それらは大量のデータのアベイラビリティに依存し,長い探査期間を必要とし,新しい目標を設定するためのエージェントを支援できない。さらに,エージェントの行動の精度を,オントロジーから抽出した概念特徴を統合することを通して,追加知能を導入することによって改善した。しかし,不調な状況が発生するとき,適切な行動を取ることに関する懸念は,取り組まれていない。本論文では,エージェントが,非意味状況を扱う新しい目標を創造し,実時間ベースでそれらの絶えず変化する環境に適応する新しい自動Goal Generation Model(AGGM)を提案した。AGGMを,交通信号制御システム事例研究におけるQ学習,SARSA,および深Qネットワークと比較した。結果は,AGGMが,ベースラインアルゴリズムと同様に,見える状況を扱う間,非意味状況におけるベースラインアルゴリズムより優れていることを示した。Copyright The Author(s) 2021 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  交通管制・規制 

前のページに戻る