プレプリント
J-GLOBAL ID:202202200974719960   整理番号:22P0285045

正則化状態-占有マッチングによる観測と例からの多目的オフライン模倣【JST・京大機械翻訳】

Versatile Offline Imitation from Observations and Examples via Regularized State-Occupancy Matching
著者 (4件):
資料名:
発行年: 2022年02月04日  プレプリントサーバーでの情報更新日: 2022年06月18日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
著者らは,状態-占有マッチングを通して導き出した新規で多目的な回帰ベースのオフライン模倣学習(IL)アルゴリズムである状態マッチングオフラインDIs属性補正推定(SMODICE)を提案した。SMODICEの目的は,Fenchel双対性の適用と表MDPsの解析解を通して簡単な最適化手順を提出する。エキスパート行動へのアクセスを必要とせずに,SMODICEは3つのオフラインIL設定に効果的に適用できる。(i)観測からの模倣(IfO),(ii)動力学または形態学的にミスマッチした専門家によるIfO,および(iii)例に基づく強化学習,を状態占有マッチング問題として定式化できる。グリッド世界環境と高次元オフラインベンチマークの両方に関するSMODICEを広範囲に評価した。著者らの結果は,SMODICEがすべての3つの問題設定に対して有効であり,事前の最先端技術よりも著しく優れていることを実証した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る