抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
階層的模倣学習(HIL)は,長い水平非セグメンテーション実証からサブスキルを学習するロボットのための有効な方法である。しかし,学習された階層構造は,マルチタスクまたは新しいタスクを横断する機構に欠けており,新しい状況に直面したとき,スクラッチから学習しなければならない。移動と再構成モジュールサブスキルは,全体階層構造の高速適応能力を必要とする。本研究では,高レベルネットワークとサブスキルがモデル診断メタ学習で反復的にメタ学習される階層的メタイミテーション学習法である二重Meta模倣学習(DMIL)を提案した。DMILは,高レベルネットワーク適応のための監視として各サブスキルから状態行動ペアの尤度を使用し,各サブスキル適応のための異なるデータセットを決定するために適応高レベルネットワークを使用する。DMILの反復訓練プロセスの収束を理論的に証明し,DMILと期待値最大化アルゴリズムの間の接続を確立した。経験的に,著者らは,Meta-世界サイト{メタワールド}ベンチマークに関する最先端の少数ショット模倣学習性能と,Kitchen環境の長水平タスクに関する競合結果を達成した。【JST・京大機械翻訳】