抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
教師なしスキル発見の問題を研究し,その目標は,外部報酬のない多様な有用なスキルの集合を学習することである。スキルと状態の間の相互情報(MI)の最大化に基づく多くのスキル発見方法がある。しかし,それらのMI目的は,通常,動的ものに対する静的スキルを好み,それは下流タスクへの適用を妨げる可能性があることを指摘した。この問題に取り組むために,著者らは,エージェントがより多様で,動的で,そして,遠いスキルを発見するためのエージェントを奨励するLipschitz制約付きスキル発見(LSD)を提案した。LSDのもう一つの利点は,その学習された表現関数が,ゼロショット法,すなわち,更なる訓練または複雑な計画無しに,目標追跡下流タスクを解くために利用できることである。種々のMuJoCoロボット移動と操作環境に関する実験を通して,LSDは,ヒューマノイドに関する複数の目標の困難なタスクを含む7つの下流タスクに関するスキル多様性,状態空間カバレッジ,および性能に関して以前のアプローチより性能が優れていることを示した。このコードとビデオはhttps://shpark.me/projects/lsd/で利用可能である。【JST・京大機械翻訳】