特許
J-GLOBAL ID:201903008313575830
制御装置、移動体、自律分散制御プログラム
発明者:
,
,
出願人/特許権者:
代理人 (2件):
中島 淳
, 加藤 和詳
公報種別:公開公報
出願番号(国際出願番号):特願2018-041148
公開番号(公開出願番号):特開2019-159413
出願日: 2018年03月07日
公開日(公表日): 2019年09月19日
要約:
【課題】特に、未知のリスクポテンシャルが点在する環境下での監視対象の追従及び探索において、追従精度向上と探索精度向上を両立させる。【解決手段】各状態行動価値関数Ψ1〜Ψ5の内、分散を最小化する行動を選択するのが最適な探索行動の選択となる。また、各状態行動価値関数Ψ1〜Ψ5の内、平均値が最大となる行動を選択するのが最適な追従行動の選択となる。行動を1つに絞るために、確定関数φを用いる。φ(s、a)は、状態行動価値関数Ψの平均値+β×状態行動価値関数Ψの分散の標準偏差で表すことができる。各行動(a1〜a5)における確定関数φ(1〜5)で得た数値の合計を分母とした、それぞれの確定関数φの演算結果を求め、行動を決定する確率として利用する。【選択図】図5
請求項(抜粋):
監視機能を備えた複数の移動体で監視対象を監視する場合に、前記複数の移動体の監視情報によって学習されていく状態行動価値関数に基づいて、自律分散的に探索しかつ追従するように、前記移動体の移動を制御する制御装置であって、
前記複数の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の分散を最小化するように前記複数の移動体毎に探索行動を選択する第1選択手段と、
前記複数の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の平均値が最大となるように前記複数の移動体毎に追従行動を選択する第2選択手段と、
前記複数の移動体毎に、前記移動体における状態及び行動の候補により決まる状態行動価値関数の平均値と分散とを用いた確定関数に基づいて、前記第1選択手段で選択した探索行動、及び前記第2選択手段で選択した追従行動を含む複数の行動の候補の何れかに確定する確定手段と、
を有する制御装置。
IPC (6件):
G05D 1/00
, G08G 5/04
, B64C 27/08
, B64C 39/02
, B64D 47/08
, B64C 13/18
FI (6件):
G05D1/00 Z
, G08G5/04
, B64C27/08
, B64C39/02
, B64D47/08
, B64C13/18 Z
Fターム (29件):
5H181AA26
, 5H181AA27
, 5H181BB04
, 5H181BB20
, 5H181CC03
, 5H181CC04
, 5H181CC11
, 5H181CC12
, 5H181CC14
, 5H181FF04
, 5H181FF05
, 5H181LL04
, 5H181LL09
, 5H301AA01
, 5H301AA04
, 5H301AA06
, 5H301BB10
, 5H301CC03
, 5H301CC04
, 5H301CC06
, 5H301CC07
, 5H301CC10
, 5H301GG08
, 5H301GG09
, 5H301GG10
, 5H301GG19
, 5H301LL03
, 5H301LL11
, 5H301LL14
引用特許: