特許
J-GLOBAL ID:200903091530933270

経路学習方法及び装置

発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願平6-184523
公開番号(公開出願番号):特開平8-050548
出願日: 1994年08月05日
公開日(公表日): 1996年02月20日
要約:
【要約】 (修正有)【目的】 固定したステートで、数個の限られたアクションのままで入出力変数を連続的に扱え、より汎用的な問題にも適用できる。【構成】 離散的に分布されている各ステートにメンバーシップ関数を配置する第1ステップ、対象が遷移する際、近傍に配置されたステートの中から1つを選択する第2ステップ、対象が通過したステートをステート番号の履歴として記憶する第3ステップ、第2ステップのステート番号と第3ステップのステート番号とが一致した時、ステート番号履歴を削除する第4ステップ、ファジィ演算処理することにより、対象の行動を決定し、実行する第5ステップ、次のステートに遷移する際、障害物を回避する第6ステップ、ゴール点に到達するまでの対象の行動結果をスタート点からゴール点までの走行距離によって行動評価する第7ステップ、及び行動評価結果に応じた報酬をメンバーシップ関数のパラメータに分配する第8ステップを経由し、前記操作を繰返して、対象が最適の行動を取るように学習を収束させる。
請求項(抜粋):
対象がスタート点からゴール点に移動する経路学習方法において、離散的に分布されている各ステートにメンバーシップ関数を配置する初期化する第1ステップと、前記対象が現在のステートから次のステートに遷移する際、その近傍に配置されたステートの中から1つを選択する第2ステップと、前記対象が通過したステートをステート番号の履歴として記憶する第3ステップと、前記第2ステップによって選択されたステート番号と前記第3ステップに記憶されているステート番号とが一致したと判断した時、経路ループしたとしてループしたステート番号履歴を削除する第4ステップと前記各ステートに配置されたメンバーシップ関数と前記対象の現在位置とからファジィ演算処理することにより、前記対象の行動を決定し、実行する第5ステップと、前記対象が次のステートに遷移する際、障害物を回避する第6ステップと、前記対象がゴール点に到達するまでの前記対象の行動結果をスタート点からゴール点までの走行距離によって評価する行動評価する第7ステップと、前記第7ステップの行動評価結果に応じた報酬を、通過した各ステートに配置されたすべてのメンバーシップ関数のパラメータに分配する報酬分配する第8ステップと、前記第2ステップから第8ステップを順次繰返し処理することで、前記対象が最適の行動を取るように学習を収束させる第9ステップとを備え、動作を行うようにしたことを特徴とする経路学習方法。
IPC (2件):
G06F 9/44 554 ,  G05D 1/02

前のページに戻る