効率的な交通信号最適化のためのバッチ増強マルチエージェント強化学習【JST・京大機械翻訳】

Wu Yueh-Hua; Yeh I-Hau; Hu David; Liao Hong-Yuan Mark

プレプリント

J-GLOBAL ID：202202204438327567 整理番号：22P0149204

効率的な交通信号最適化のためのバッチ増強マルチエージェント強化学習【JST・京大機械翻訳】

Batch-Augmented Multi-Agent Reinforcement Learning for Efficient Traffic Signal Optimization

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2020年05月19日プレプリントサーバーでの情報更新日： 2020年05月19日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

本研究の目的は,交通信号制御問題のための強化学習に基づく実行可能な解決策を提供することである。最先端の強化学習手法は様々な分野で大きな成功をもたらしたが,高いサンプル効率の要件と訓練データが集められるかを考慮して,交通渋滞を軽減するためにそれを直接適用することは挑戦的である。本研究では,大都市圏で発生する重大な交通渋滞を緩和することを試みたときに遭遇するいくつかの課題に取り組んだ。特に,強化学習のための情報を検索する特定の監視カメラがダウン,トラフィックシミュレータなしでバッチデータから学習すること,および(3)交差点を横断して共有情報なしで制御決定を行うとき,トラフィック信号制御を扱うことができる解決策を提供する必要がある。上記の状況を扱う2段階フレームワークを提示した。フレームワークは,固定時間トラフィック信号制御スケジュールと3つの提案コンポーネント,有界動作,バッチ増強,および代理報酬クリッピングの支援でバッチデータから学習できるマルチエージェントオフポリシー強化学習を与える進化戦略アプローチに分解できる。実験により,提案フレームワークは,現在使用されている固定時間トラヒック信号計画と比較して,待ち時間に関してトラヒック輻輳を36%低減することを示した。さらに,このフレームワークは,結果を達成するためにシミュレータに600のクエリだけを必要とする。【JST・京大機械翻訳】

, , , , , , ,
, , , , , , , , 【Automatic Indexing@JST】

交通管制・規制 , 人工知能

, , , , ,

前のページに戻る