特許
J-GLOBAL ID:200903072221399052

動作選択システム、動作選択方法、予測マシントレーニングシステム、予測マシントレーニング方法及び予測マシン

発明者:
出願人/特許権者:
代理人 (3件): 小池 晃 ,  田村 榮一 ,  伊賀 誠司
公報種別:公表公報
出願番号(国際出願番号):特願2007-523042
公開番号(公開出願番号):特表2008-508581
出願日: 2005年07月26日
公開日(公表日): 2008年03月21日
要約:
システム状態及びコンテキストパラメータによって記述されるシステム又はセットアップSに生来的な関係の効率的学習を促進するために、セットアップに影響する、実行される次の動作を、この動作から生じると予想される知識利得に基づいて決定する。知識利得は、動作を実行した後の知識インジケータパラメータの値を、システム状態/コンテキストパラメータ及び動作変数が現在のものと同様の値を有する1つ以上の前の機会のこのインジケータの値と比較することによって、「ローカルに」評価される。好ましくは、「知識のレベル」は、予測モジュールによって生成される予測の精度に基づいて評価される。一連の動作の選択に予測マシンを参加させることによって、この技術を用いて、予測マシンをトレーニングすることができる。また、この技術を用いて、動作選択技術に基づいて選択された一連の動作を実行する自己発達装置又はシステムの発達を管理することができる。
請求項(抜粋):
実行することができ、セットアップSに影響する動作を定義する1つ以上の動作変数の値を指定する信号を生成する自動化された動作選択システム(1)において、 上記セットアップSの状態及び/又はコンテキストを記述する0個以上のシステム状態/コンテキストパラメータ(SC(t))の組の、時間tにおける値を示す信号が供給される入力手段と、 システム状態/コンテキストパラメータ及び動作変数の組のそれぞれ異なるパラメータ又は変数によって各次元が定義される多次元のシステム状態/コンテキスト/動作空間内の領域の組を定義する領域画定器(2)と、 上記動作変数の可能な値の組をそれぞれ含む候補動作の組を判定する判定手段と、 所定の候補動作と、時刻tにおける任意のシステム状態/コンテキストパラメータの値との組合せを含むシステム状態/コンテキスト/動作空間内の領域を特定する領域識別器(2)と、 所定の候補動作と、時刻tにおける任意の幾つかのシステム状態/コンテキストパラメータとの組合せを含むシステム状態/コンテキスト/動作空間の領域に依存する予測関数を適用し、時刻tの後の所定の間隔で、1つ以上の予測された変数(VAR)の値を予測する予測手段(12)と、 所定の候補動作と、時刻tにおける任意のシステム状態/コンテキストパラメータの値との組合せを含むシステム状態/コンテキスト/動作空間の領域に応じて、該所定の候補動作が実行された場合、上記予測手段(12)の性能における予想される向上を評価する評価手段(14)と、 上記評価手段(14)によって、上記所定の候補動作について評価された上記予測手段(12)の性能における上記予想される向上に基づき、実行のために所定の候補動作を選択する望ましさを示す信号を生成する生成手段とを備える自動化された動作選択システム。
IPC (1件):
G06N 3/00
FI (1件):
G06N3/00 550E
引用特許:
審査官引用 (1件)
  • エージェント学習装置
    公報種別:公開公報   出願番号:特願平10-203760   出願人:科学技術振興事業団, 銅谷賢治, 川人光男
引用文献:
審査官引用 (2件)

前のページに戻る