文献
J-GLOBAL ID:202202271174337982   整理番号:22A0457657

敵対的環境生成による分散型ロバストポリシー学習【JST・京大機械翻訳】

Distributionally Robust Policy Learning via Adversarial Environment Generation
著者 (2件):
資料名:
巻:号:ページ: 1379-1386  発行年: 2022年 
JST資料番号: W2448A  ISSN: 2377-3766  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
著者らの目標は,環境を良好に一般化する制御政策を訓練することである。分散ロバスト最適化(DRO)フレームワークに触発されて,著者らは,敵対的環境を生成することによって現実的分布シフトに対する政策のロバスト性を反復的に改善するために,ENVironmentのAdversarial Generationを介して,DRAGEN ΔΣ分布ロバスト政策学習を提案する。重要なアイデアは,潜在変数が環境におけるコスト予測と現実的変動を捉える環境に対する生成モデルを学習することである。潜在空間上の勾配上昇により現実的な敵対環境を生成することにより,環境の経験的分布周辺のWasserstein球に関してDROを行った。(i)オンボードビジョンで振り子をスイングし,(ii)現実的な3D物体を把持する(i)シミュレーションにおいて,強い属性外(OoD)一般化を示した。ハードウェアに関するグラッピング実験は,ドメインランダム化と比較して,より良いsim2現実の性能を示した。Copyright 2022 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (4件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  音声処理  ,  音響測定  ,  音響信号処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る