抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
実世界におけるいくつかの目標指向問題は,確率的最短経路問題(SSP)として自然に表現できる。しかし,SSPを解く計算の複雑さは,解を中程度にサイズの問題に対して解決する。現在,既存の最先端の計画者と発見的方法は,他の事例を解くことから学習された知識をしばしば活用できない。本論文では,解プロセスを触媒するために使用できる非決定論的部分ポリシーを学習する,学習したポリシーオートマトン(GPA)に対するアプローチを提示した。GPAsは,関係,特徴ベース抽象化を用いて学習され,異なるオブジェクト名と量を持つ広範囲の関連問題に適用できる。このアプローチの理論解析は,それが完全性と階層的最適性を保証することを示した。経験的解析は,この手法が,数ショット方式で広く適用可能なポリシー知識を効果的に学習し,そのオブジェクト数が訓練中に使用されたものよりはるかに大きいテスト問題に関する最先端のSSPソルバーを著しく凌駕することを示した。【JST・京大機械翻訳】