抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
人間によって実証される運動主義の不可解なフェアは,実践と経験の年を通して獲得された汎用運動技能の広大なレパートリーによって,部分的に可能になった。これらのスキルは,人間が複雑なタスクを実行するだけでなく,新しいタスクを学習するとき,それらの行動を導くための強力な事前を提供する。これは,物理ベース特性アニメーションにおける一般的実践であると対照的であり,そこでは,制御ポリシーが各タスクに対してスクラッチから最も典型的に訓練される。本研究では,物理的にシミュレートした特徴のための多目的で再使用可能なスキル埋込みを学習するための大規模データ駆動フレームワークを提案した。提案アプローチは,敵対的模倣学習と教師なし強化学習からの技術を結合して,寿命様行動を生成するスキル埋込みを開発し,一方,新しい下流タスクの使用のための表現を容易に提供する。著者らのモデルは,運動データのタスク特異的アノテーションやセグメンテーションを必要とせずに,非構造化動きクリップの大きなデータセットを用いて訓練できる。大規模並列GPUベースシミュレータを活用することにより,シミュレーション経験の10年以上にわたってスキル埋込みを訓練でき,このモデルがスキルの豊富で多用途なレパートリーを学習することを可能にする。単一事前訓練モデルは,多様な新しいタスクを実行するのに有効に適用できることを示した。また,このシステムは,ユーザが単純な報酬関数を通してタスクを指定することを可能にし,次に,スキル埋込みは,タスク目的を達成するために,複雑で自然な戦略を自動的に合成することを可能にする。【JST・京大機械翻訳】