抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多数の実世界シナリオでは,エージェントに外的報酬は非常に疎な,または全く無かった。このような場合,好奇心はその環境を調査し,その寿命の後半で有用であることをスキルを学習する剤可能にする固有報酬信号として役立つことができる。自己教師つき逆動力学モデルにより学習された視覚的特徴量空間においてその自身の行動の結果を予測する能力エージェントのにおける誤差として好奇心を定式化した。この定式化は,画像のような高次元連続状態空間にスケールし,画素を予測する直接の困難を迂回して,批判的に,エージェントに影響しないことを環境の側面を無視している。提案アプローチでは,二種類の環境:VizDoomとSuper Mario Bros社で評価した。三つの広い設定について調べた1)スパース外因性報酬2)外因性報酬;による探査および3)見えないシナリオへの一般化は,(例えば同じゲームの新しいレベル)。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】