Asyncval:トレーニング中の高密度検索者チェックポイントを非同期的に検証するためのツールキット【JST・京大機械翻訳】

Zhuang Shengyao; Zuccon Guido

プレプリント

J-GLOBAL ID：202202219733009914 整理番号：22P0295122

Asyncval:トレーニング中の高密度検索者チェックポイントを非同期的に検証するためのツールキット【JST・京大機械翻訳】

Asyncval: A Toolkit for Asynchronously Validating Dense Retriever Checkpoints during Training

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年02月25日プレプリントサーバーでの情報更新日： 2022年04月26日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。

モデルチェックポイント検証のプロセスは,モデルのハイパーパラメータを学習しながら,訓練データの開催部分上で実行されるモデルチェックポイントの性能の評価を指し,また,モデルが訓練を停止するように収束する時,過剰適合を避けて,決定するために使用する。深層学習チェックポイントを検証する簡単で効率的な戦略は,訓練中に実行するための検証ループの追加である。しかし,高密度検索者(DR)チェックポイントの検証は自明ではなく,検証ループの追加は効率的でない。これは,DRチェックポイントの性能を正確に評価するため,チェックポイント検証のための実際の検索操作の前に,全文書コーパスを現在のチェックポイントを用いてベクトルに符号化する必要がある。このコーパス符号化プロセスは,文書コーパスが数百万の文書(例えば,MSMARCOに対して8.8m,自然質問に対して21m)を含むならば,非常に時間がかかる。したがって,訓練中の検証ループのナイーブな使用は訓練時間を著しく増加させる。この問題に取り組むため,本論文では,訓練中のDRチェックポイントを効率的に検証するためのPythonベースツールキットを提案する。DRチェックポイントの検証のために訓練ループを休止する代わりに,Asyncvalは訓練ループから検証ループを分離し,他のGPUを用いて新しいDRチェックポイントを自動的に検証して,訓練から非同期的に検証を行うことができた。また,Asyncvalは,DRチェックポイントを検証するために,異なるコーパスサブセットサンプリング戦略の範囲を実行する。これらの戦略は,検証プロセスをさらにスピードアップすることを可能にする。検証時間と検証忠実度への影響に関して,これらの方法の調査を提供した。https://github.com/ielab/asyncvalでのオープンソースプロジェクトとしてアシンバルが利用できる。【JST・京大機械翻訳】

, ,
, , , , , , , 【Automatic Indexing@JST】

その他のディジタル計算機方式 , ディジタル計算機方式一般

, , , , , ,

前のページに戻る