軌道バランス:GFlowNetにおける改良型クレジット割当【JST・京大機械翻訳】

Malkin Nikolay; Jain Moksh; Bengio Emmanuel; Sun Chen; Bengio Yoshua

プレプリント

J-GLOBAL ID：202202205080325008 整理番号：22P0282419

軌道バランス:GFlowNetにおける改良型クレジット割当【JST・京大機械翻訳】

Trajectory balance: Improved credit assignment in GFlowNets

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2022年01月31日プレプリントサーバーでの情報更新日： 2023年10月04日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

生成フローネットワーク(GFlowNets)は,行動のシーケンスによって与えられた非正規化密度から,グラフやストリングのような構成オブジェクトを生成するための確率的ポリシーを学習するための方法であり,そこでは,多くの可能な行動シーケンスが同じオブジェクトにつながる可能性がある。著者らは以前に提案したGFlowNets,フローマッチング,および詳細なバランスのための学習目的を見出し,それは時間的差異学習と類似であり,長い動作シーケンスにわたって非効率的な信用伝搬の傾向がある。したがって,以前に使用された目的に対するより効率的な代替として,GFlowNets,軌道バランスに対する新しい学習目標を提案した。軌道バランス目的の大域的最小化器は,ターゲット分布から正確にサンプルがサンプリングするポリシーを定義できることを証明した。4つの異なるドメインに関する実験において,著者らは,GFlowNet収束のための軌道バランス目標,生成サンプルの多様性,および長い動作配列と大きな行動空間に対するロバスト性の利益を経験的に実証した。【JST・京大機械翻訳】

, , , ,
, , 【Automatic Indexing@JST】

人工知能 , パターン認識

, , ,

前のページに戻る