Pat
J-GLOBAL ID:201303089517993998

強化学習装置および強化学習方法

Inventor:
Applicant, Patent owner:
Agent (1): 佐藤 隆久
Gazette classification:特許公報
Application number (International application number):2005254763
Publication number (International publication number):2007066242
Patent number:4929449
Application date: Sep. 02, 2005
Publication date: Mar. 15, 2007
Claim (excerpt):
【請求項1】 状態と行動の対に対して価値関数値を決定し保持する価値関数値保持部と、 前記価値関数保持部から渡される価値関数値集合の中から1つの値を選択し、選択した値を基に行動を選択する行動選択部と、 状態が遷移した時に価値関数値を更新する価値関数値更新部と、 を有し、 前記価値関数値は複素数であり、 前記価値関数値更新部は、前記価値関数値の更新式において、直前の行動の複素価値関数値との位相差を考慮して複素価値関数値を更新する 強化学習装置。
IPC (2):
G06N 3/00 ( 200 6.01) ,  G05B 13/02 ( 200 6.01)
FI (2):
G06N 3/00 550 E ,  G05B 13/02 L
Article cited by the Patent:
Return to Previous Page