特許
J-GLOBAL ID:200903038880378891

多層化された状態空間に対する問題解決器

発明者:
出願人/特許権者:
代理人 (1件): 山谷 晧榮 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-176788
公開番号(公開出願番号):特開2002-366358
出願日: 2001年06月12日
公開日(公表日): 2002年12月20日
要約:
【要約】【課題】多層化された状態空間中で、サブゴールへの経路探索で状態S1と状態S2との間の移動を繰り返すこと、あるいはゴールへの経路探索で状態S3と状態S4との間の移動を繰り返すことを防止すること。【解決手段】多層化された認知距離学習器の、各レイヤエージェント1-1、1-2、1-3の実行機構において、現在の状態と目的地の状態が同じかどうかを判定するサブゴール判定手段9及びゴール判定手段10と、以前に取得した目的地を再現するサブゴール保持手段11及びゴール判定保持手段12を備えたことを特徴とする。
請求項(抜粋):
ある問題により定義される多層化された状態空間中で初期状態とゴールとが与えられたときに該初期状態から該ゴールに至るまでの行動系列を生成する問題解決器であって、前記状態空間中における任意状態から前記ゴールに到達するまでの行動系列の実行により費やされる、該状態空間の環境に対して作用させるコストを示す認知距離を学習する認知距離モジュールと、前記状態空間中における任意の状態において遷移しうる次状態を提示するフォワードモデルと、前記認知距離モジュールによる認知距離の学習結果に基づいて、前記行動系列に属することとなる行動であって、前記ゴールに至るための前記状態空間中の特定状態において次に実行すべき次行動を決定する次行動決定手段として、前記フォワードモデルにより提示される次状態のうち、ゴールへ近いものを優先的に選択する認知距離学習器と、この認知距離学習器を多層的に積み重ねた問題解決器において、現在の状態と目的地の状態が同一か否かを判定する到達判定手段と、それ以前に取得した目的地を再現する目的地保持手段を具備したことを特徴とする問題解決器。
引用文献:
審査官引用 (3件)

前のページに戻る