二重Meta模倣学習による階層構造移動【JST・京大機械翻訳】

Gao Chongkai; Jiang Yizhou; Chen Feng

プレプリント

J-GLOBAL ID：202202212816583260 整理番号：22P0281141

二重Meta模倣学習による階層構造移動【JST・京大機械翻訳】

Transfering Hierarchical Structure with Dual Meta Imitation Learning

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年01月28日プレプリントサーバーでの情報更新日： 2022年02月18日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

階層的模倣学習(HIL)は,長い水平非セグメンテーション実証からサブスキルを学習するロボットのための有効な方法である。しかし,学習された階層構造は,マルチタスクまたは新しいタスクを横断する機構に欠けており,新しい状況に直面したとき,スクラッチから学習しなければならない。移動と再構成モジュールサブスキルは,全体階層構造の高速適応能力を必要とする。本研究では,高レベルネットワークとサブスキルがモデル診断メタ学習で反復的にメタ学習される階層的メタイミテーション学習法である二重Meta模倣学習(DMIL)を提案した。DMILは,高レベルネットワーク適応のための監視として各サブスキルから状態行動ペアの尤度を使用し,各サブスキル適応のための異なるデータセットを決定するために適応高レベルネットワークを使用する。DMILの反復訓練プロセスの収束を理論的に証明し,DMILと期待値最大化アルゴリズムの間の接続を確立した。経験的に,著者らは,Meta-世界サイト{メタワールド}ベンチマークに関する最先端の少数ショット模倣学習性能と,Kitchen環境の長水平タスクに関する競合結果を達成した。【JST・京大機械翻訳】

, , , , , , , , ,
, , , , , , 【Automatic Indexing@JST】

人工知能 , ロボットの運動・制御

前のページに戻る