プレプリント
J-GLOBAL ID:202202213923618064   整理番号:22P0327562

挑戦環境におけるロボット探索のためのオンライン適応によるオフポリシー評価【JST・京大機械翻訳】

Off-Policy Evaluation with Online Adaptation for Robot Exploration in Challenging Environments
著者 (5件):
資料名:
発行年: 2022年04月06日  プレプリントサーバーでの情報更新日: 2023年05月24日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自律探査には多くの重要な応用がある。しかし,古典的情報利得ベースまたはフロンティアベースの探索は,ロボット電流状態に依存し,将来の状態の価値を予測する能力がなく,従って,非効率な探査決定につながる。本論文では,実世界の挑戦的な環境におけるロボット探索のためのガイダンスを提供するために,状態値関数によって測定される「良い」状態がどのように,どうかを学習する方法を提示する。ロボット探査(OPERE)のためのオフポリシー評価(OPE)問題として著者らの研究を定式化した。それは,実世界データに関するオフラインモンテカルロ訓練から成り,訓練値推定器を最適化するために時間差(TD)オンライン適応を実行する。また,センサ情報カバレッジに基づく固有報酬関数を設計し,ロボットがスパース外因性報酬でより多くの情報を得ることを可能にした。結果は,著者らの方法がロボット探査をよりよく誘導するために,ロボットが将来の状態の価値を予測することができることを示した。提案アルゴリズムは最先端技術と比較してより良い予測と探査性能を達成した。知る限りでは,本研究は,挑戦的な地下と都市環境におけるロボット探査のための実世界データセットに関する価値関数予測を初めて示した。より多くの詳細とデモビデオをhttps://jeffreyyh.github.io/opere/で見つけることができる。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
ロボットの運動・制御  ,  人工知能 

前のページに戻る