関係確率最短経路問題のための一般化ポリシーオートマトンの学習【JST・京大機械翻訳】

Karia Rushang; Nayyar Rashmeet Kaur; Srivastava Siddharth

プレプリント

J-GLOBAL ID：202202203732002599 整理番号：22P0328723

関係確率最短経路問題のための一般化ポリシーオートマトンの学習【JST・京大機械翻訳】

Learning Generalized Policy Automata for Relational Stochastic Shortest Path Problems

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年04月08日プレプリントサーバーでの情報更新日： 2022年10月11日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

実世界におけるいくつかの目標指向問題は,確率的最短経路問題(SSP)として自然に表現できる。しかし,SSPを解く計算の複雑さは,解を中程度にサイズの問題に対して解決する。現在,既存の最先端の計画者と発見的方法は,他の事例を解くことから学習された知識をしばしば活用できない。本論文では,解プロセスを触媒するために使用できる非決定論的部分ポリシーを学習する,学習したポリシーオートマトン(GPA)に対するアプローチを提示した。GPAsは,関係,特徴ベース抽象化を用いて学習され,異なるオブジェクト名と量を持つ広範囲の関連問題に適用できる。このアプローチの理論解析は,それが完全性と階層的最適性を保証することを示した。経験的解析は,この手法が,数ショット方式で広く適用可能なポリシー知識を効果的に学習し,そのオブジェクト数が訓練中に使用されたものよりはるかに大きいテスト問題に関する最先端のSSPソルバーを著しく凌駕することを示した。【JST・京大機械翻訳】

, , , ,
, , , 【Automatic Indexing@JST】

人工知能 , オートマトン理論 , 数値計算

, , , ,

前のページに戻る