特許
J-GLOBAL ID:202003002500506713

マルチポリシー意思決定を導くための有益な結果を構築するための方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人浅村特許事務所
公報種別:公表公報
出願番号(国際出願番号):特願2019-550667
公開番号(公開出願番号):特表2020-511721
出願日: 2018年03月16日
公開日(公表日): 2020年04月16日
要約:
マルチポリシー意思決定(MPDM)では、一組の候補ポリシーの性能を予測するために、多くの計算コストの高いフォワードシミュレーションが実行される。MPDMのリスクを意識した定式化では、最悪の結果のみが意思決定プロセスに影響を及ぼし、これらの影響力のある結果を効率的に見つけることが最も重要な課題となる。最近、ヒューリスティック関数を使用した確率的勾配最適化アルゴリズムがランダムサンプリングよりも著しく優れていることが示された。この開示では、正確な勾配は、複雑なフォワードシミュレーションによっても、depネットワークにおける手法と同様の手法を使用して計算できることが示された。提案された手法は影響を与える結果をより確実に見つけ、また以前の方法よりも速く、より容易に区別可能なヒューリスティック関数を設計する必要性を排除しながらより多くのポリシーを評価することを可能にする。
請求項(抜粋):
環境内の制御対象物にコマンドを発行するための、コンピュータにより実装される方法であって、 一組のポリシーの各ポリシーであって、前記ポリシーが前記制御対象物が実装する前記コマンドを指定し、前記コマンドが前記制御対象物の動きに直接影響を与える各ポリシーについて、 前記制御対象物および1つまたは複数の監視対象物の各々について状態推定値を受け取るステップであって、各状態推定値は状態要素を含み、前記状態要素は前記それぞれの対象物の位置および前記それぞれの対象物の速度を示す、ステップと、 前記制御対象物および前記1つまたは複数の監視対象物の各々についてシード状態を生成するステップと、 前記制御対象物および前記シード状態を使用して前記1つまたは複数の監視対象物の動きをシミュレートするステップであって、前記シミュレーションは、前記それぞれのポリシーを実行する前記制御対象物を含む、ステップと、 前記シード状態を用いて前記シミュレーションの結果にコストを割り当てるステップと、 前記シード状態に関連する確率を決定するステップと、 前記コストおよび前記確率に基づいて前記シード状態を用いて前記シミュレーションの結果を定量化するステップと、 揺動された入力を使用して前記1つまたは複数の監視対象物および前記制御対象物の動きをシミュレートするステップであって、 揺動されたシード状態を決定するために、前記シード状態のうちの少なくとも1つの状態要素を揺動し、前記揺動されたシード状態を使用して、前記制御対象物および前記1つまたは複数の監視対象物の動きをシミュレートし、 前記揺動されたシード状態を用いて前記シミュレーションの結果に揺動されたコストを割り当て、 前記揺動されたシード状態に関連する揺動された確率を決定し、 前記揺動されたコストおよび前記揺動された確率に基づいて、前記揺動されたシード状態を用いて前記シミュレーションの揺動された結果を定量化し、 所定の条件が満たされるまで、揺動された入力を用いて前記制御対象物および前記1つまたは複数の監視対象物の動きの前記シミュレーションを繰り返し、それによって複数の揺動された結果を生成するステップと、 前記それぞれのポリシーについてポリシースコアを決定するステップであって、前記ポリシースコアは、前記それぞれのポリシーについての前記複数の揺動された結果の中で最も高い値を有する前記揺動された結果に相関する、ステップと、 前記一組のポリシーから所与のポリシーを選択するステップであって、前記の所与のポリシーは、前記一組のポリシー内の前記ポリシーの中で最も良性の結果を有する、ステップと、 前記所与のポリシーに従って、前記制御対象物に前記コマンドを発行するステップと、 を含む方法。
IPC (3件):
G06F 17/11 ,  G06N 3/08 ,  G05B 13/04
FI (3件):
G06F17/11 ,  G06N3/08 140 ,  G05B13/04
Fターム (13件):
5B056BB64 ,  5B056BB91 ,  5H004GA30 ,  5H004GA34 ,  5H004GB12 ,  5H004GB16 ,  5H004KB02 ,  5H004KB04 ,  5H004KB06 ,  5H004KB12 ,  5H004KC22 ,  5H004KC27 ,  5H004KC33
引用特許:
出願人引用 (1件)
  • 自律移動体
    公報種別:公開公報   出願番号:特願2011-182168   出願人:株式会社豊田中央研究所

前のページに戻る