特許
J-GLOBAL ID:201303021846841836
問題解決器として動作するデータ処理装置、及び記憶媒体
発明者:
,
,
出願人/特許権者:
代理人 (2件):
大菅 義之
, 久木元 彰
公報種別:特許公報
出願番号(国際出願番号):特願2000-352343
公開番号(公開出願番号):特開2002-157571
特許番号:特許第4699598号
出願日: 2000年11月20日
公開日(公表日): 2002年05月31日
請求項(抜粋):
【請求項1】 ある問題により定義される状態空間中で初期状態と目標状態とが与えられたときに該初期状態から該目標状態に至るまでの行動系列を生成する問題解決器として動作するデータ処理装置であって、
前記状態空間中における任意の状態から前記目標状態に到達するまでの行動系列の実行によって費やされる、該状態空間の環境に対して作用させるコストを示す認知距離を学習する認知距離学習手段と、
前記認知距離学習手段による認知距離の学習結果に基づいて、前記行動系列に属することとなる行動であって、前記目標状態に至るために前記状態空間中の特定の状態において次に実行すべき該行動である次行動を決定する次行動決定手段と、
を有しており、
前記認知距離学習手段は、前記任意の状態と前記目標状態と該目標状態での前記行動とに基づき、該任意の状態と該任意の状態において実行し得る行動とよりなるベクトルから該目標状態と該目標状態での前記行動とよりなるベクトルへの移動に要する距離を、前記認知距離として算出して、該任意の状態において実行し得る行動と該認知距離との関係を示す距離リストを生成し、
前記次行動決定手段は、前記任意の状態において前記認知距離が最も短くなる行動を、前記次行動として、前記距離リストに基づき選択し、
前記任意の状態と、該任意の状態において前記次行動決定手段が選択した行動とよりなるベクトルを、該次行動決定手段による選択の履歴として保持する状態-行動保持手段を更に有しており、
前記認知距離学習手段は、前記認知距離の算出を行うときに、該認知距離の算出の対象である、状態と該状態において実行し得る行動とよりなるベクトルが前記状態-行動保持手段に保持されていた場合には、前記距離リストにおいて該ベクトルに関係付けられている認知距離と該算出により算出された認知距離とを比較し、該算出された認知距離の方が短い場合には、該距離リストにおいて該ベクトルに関係付けられている認知距離を、該算出された認知距離に変更する、
ことを特徴とするデータ処理装置。
IPC (1件):
FI (1件):
引用特許:
引用文献: