特許
J-GLOBAL ID:201103048501449071

内部変数推定装置、内部変数推定方法及び内部変数推定プログラム

発明者:
出願人/特許権者:
代理人 (3件): 小谷 悦司 ,  植木 久一 ,  大月 伸介
公報種別:特許公報
出願番号(国際出願番号):特願2003-310408
公開番号(公開出願番号):特開2005-078519
特許番号:特許第3703822号
出願日: 2003年09月02日
公開日(公表日): 2005年03月24日
請求項(抜粋):
【請求項1】 学習者の学習プロセスをモデル化した学習モデルの内部変数を推定する内部変数推定装置であって、 前記学習モデルの観測可能な外部変数を取得する取得手段と、 前記学習モデルをベイジアンネットワークにより表現して前記外部変数からベイズ推定を用いて前記内部変数を推定する推定手段とを備え、 前記外部変数は、学習者の行動を表す変数と、前記行動に対して得られる報酬を表す変数とを含み、 前記内部変数は、行動選択の乱雑さを表すメタパラメータと、学習率を表すメタパラメータと、行動価値関数を表すパラメータとを含み、 前記ベイジアンネットワークは、前記行動を表す変数と、前記報酬を表す変数と、前記行動選択の乱雑さを表すメタパラメータと、前記学習率を表すメタパラメータと、前記行動価値関数を表すパラメータとを含み、 前記推定手段は、前記行動を表す変数及び前記報酬を表す変数からベイズ推定を用いて前記行動選択の乱雑さを表すメタパラメータ、前記学習率を表すメタパラメータ及び前記行動価値関数を表すパラメータを推定することを特徴とすることを特徴とする内部変数推定装置。
IPC (1件):
G06N 1/00
FI (1件):
G06N 1/00 510

前のページに戻る