特許
J-GLOBAL ID:202103004204664630

潜在コスト推定装置、方法、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人太陽国際特許事務所
公報種別:特許公報
出願番号(国際出願番号):特願2017-101265
公開番号(公開出願番号):特開2018-197892
特許番号:特許第6789176号
出願日: 2017年05月22日
公開日(公表日): 2018年12月13日
請求項(抜粋):
【請求項1】移動する対象物が状態間を遷移した履歴を表す遷移履歴データ、及び前記状態間の基本遷移関数を入力とし、各状態の目的地への到達し易さを表す価値関数の尤もらしさを表す尤度関数であって、前記状態間の基本遷移関数により定まる前記状態間の基本遷移確率を用いて表される、最適方策により行動を選択する場合の状態間の遷移確率、及び前記遷移履歴データから得られる状態間の遷移回数を用いて表される前記尤度関数に、前記状態間の基本遷移確率から求められる、隣接する状態間の価値関数が類似した値となることを表すグラフラプラシアン正則化項を加えた目的関数を最小化又は最大化するように、予め定められた反復終了条件を満たすまで、各状態の目的地への到達し易さを表す価値関数を更新することを繰り返すことにより、各状態の価値関数を推定する価値関数推定部と、 前記価値関数推定部によって推定された各状態の価値関数、及び前記状態間の基本遷移確率を用いて表される、最適方策により行動を選択する場合の状態間の遷移確率に基づいて、各状態についての目的地らしさを表す報酬関数を計算する報酬関数計算部と、 を含み、 前記尤度関数をL(v)、前記遷移回数をn・j及びnj・、0以上1未満の定数である割引率をγ、前記価値関数をvj及びvk、前記基本遷移確率をp-jk(-はpの直上)とした場合に、前記尤度関数L(v)は、
IPC (1件):
G06N 20/00 ( 201 9.01)
FI (1件):
G06N 20/00
引用文献:
審査官引用 (1件)
  • Inverse Optimal Control with Linearly-Solvable MDPs

前のページに戻る