抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
生成フローネットワーク(GFlowNets)は,行動のシーケンスによって与えられた非正規化密度から,グラフやストリングのような構成オブジェクトを生成するための確率的ポリシーを学習するための方法であり,そこでは,多くの可能な行動シーケンスが同じオブジェクトにつながる可能性がある。著者らは以前に提案したGFlowNets,フローマッチング,および詳細なバランスのための学習目的を見出し,それは時間的差異学習と類似であり,長い動作シーケンスにわたって非効率的な信用伝搬の傾向がある。したがって,以前に使用された目的に対するより効率的な代替として,GFlowNets,軌道バランスに対する新しい学習目標を提案した。軌道バランス目的の大域的最小化器は,ターゲット分布から正確にサンプルがサンプリングするポリシーを定義できることを証明した。4つの異なるドメインに関する実験において,著者らは,GFlowNet収束のための軌道バランス目標,生成サンプルの多様性,および長い動作配列と大きな行動空間に対するロバスト性の利益を経験的に実証した。【JST・京大機械翻訳】