文献
J-GLOBAL ID:202002212997018818   整理番号:20A1117778

強化学習によって獲得される高度なディスパッチング戦略【JST・京大機械翻訳】

Can Sophisticated Dispatching Strategy Acquired by Reinforcement Learning?
著者 (8件):
資料名:
号: AAMAS ’19  ページ: 1395-1403  発行年: 2019年 
JST資料番号: D0698C  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文において,著者らはAlibabaのオンラインピックアップサービスプラットフォームから上げられた,より良いディスパッチ問題(CDP)を研究した。CDPは,都市域の間の確率的空間的および時間的到着率によるピックアップ要求を提供するために,一組の求愛者を割り当てることを目的とした。目的は,時間の期間にわたって限られた数のコースを与えられたサービス要求の収入を最大化することである。既存の文献からの動的マッチングおよび車両経路選定戦略のような多くのオンラインアルゴリズムを,この問題に取り組むために適用することができた。しかしながら,これらの方法は,各決定点における適切に予め定義された最適化目的に依存しており,それは動的状況において困難である。本論文では,Markov決定プロセス(MDP)としてCDPを定式化し,異なるシナリオの下で最適ディスパッチルール集合を導出するためのデータ駆動アプローチを提案した。著者らの方法は,空間的および時間的マップの多層画像をスタックして,マルチエージェント強化学習(MARL)技術を適用して,ディスパッチングモデルを進化させた。本方法は,従来の集中化MDPモデリングによって引き起こされた学習非効率性を解決した。人工データセットと実世界データセットの両方に関する包括的実験を通して,著者らは示した。1)歴史的データを利用し,長期収益利得を考慮することにより,MARLは近視オンラインアルゴリズムよりも良好な性能を達成した。2)MARLは,複雑なシナリオ間のマッピングを,ディスパッチルールのような洗練された決定に構築することができる。3)MARLは,大規模実世界シナリオで採用するスケーラビリティを持っている。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
物的流通  ,  ロボットの運動・制御  ,  輸送方法・施設 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る