抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多くの実世界問題はグラフ上の組合せ最適化に低減でき,そこでは,いくつかの目的関数を最大化する頂点の部分集合または順序付けを見つける必要がある。このようなタスクはしばしばNP困難で解析的に扱いにくいため,強化学習(RL)は,これらの問題に取り組むための効率的な発見的方法が学習できるフレームワークとして有望性を示している。以前の研究は,時間的に1つの要素を加えることで,解部分集合を漸増的に構築するが,しかし,このアプローチの不可逆的な性質は,最適化タスクの複雑性を与える必要のある,その初期の決定を見直すことからエージェントを防いだ。代わりに,エージェントは,試験時間において探索するために学習によって解を連続的に改善する必要があることを提案した。探索的組合せ最適化(ECO-DQN)の手法は,原理的に,グラフ上で定義できる任意の組合せ問題に適用できる。実験的に,最大Cut問題に対して最先端のRL性能を生成する方法を示した。さらに,ECO-DQNは任意の任意構成から開始できるため,他の探索法と組み合わせることができ,さらに性能を改善し,簡単なランダム探索を用いて実証した。【JST・京大機械翻訳】