挑戦環境におけるロボット探索のためのオンライン適応によるオフポリシー評価【JST・京大機械翻訳】

Hu Yafei; Geng Junyi; Wang Chen; Keller John; Scherer Sebastian

プレプリント

J-GLOBAL ID：202202213923618064 整理番号：22P0327562

挑戦環境におけるロボット探索のためのオンライン適応によるオフポリシー評価【JST・京大機械翻訳】

Off-Policy Evaluation with Online Adaptation for Robot Exploration in Challenging Environments

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2022年04月06日プレプリントサーバーでの情報更新日： 2023年05月24日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

自律探査には多くの重要な応用がある。しかし,古典的情報利得ベースまたはフロンティアベースの探索は,ロボット電流状態に依存し,将来の状態の価値を予測する能力がなく,従って,非効率な探査決定につながる。本論文では,実世界の挑戦的な環境におけるロボット探索のためのガイダンスを提供するために,状態値関数によって測定される「良い」状態がどのように,どうかを学習する方法を提示する。ロボット探査(OPERE)のためのオフポリシー評価(OPE)問題として著者らの研究を定式化した。それは,実世界データに関するオフラインモンテカルロ訓練から成り,訓練値推定器を最適化するために時間差(TD)オンライン適応を実行する。また,センサ情報カバレッジに基づく固有報酬関数を設計し,ロボットがスパース外因性報酬でより多くの情報を得ることを可能にした。結果は,著者らの方法がロボット探査をよりよく誘導するために,ロボットが将来の状態の価値を予測することができることを示した。提案アルゴリズムは最先端技術と比較してより良い予測と探査性能を達成した。知る限りでは,本研究は,挑戦的な地下と都市環境におけるロボット探査のための実世界データセットに関する価値関数予測を初めて示した。より多くの詳細とデモビデオをhttps://jeffreyyh.github.io/opere/で見つけることができる。【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , 【Automatic Indexing@JST】

ロボットの運動・制御 , 人工知能

, , , , ,

前のページに戻る