プレプリント
J-GLOBAL ID:202202219733009914   整理番号:22P0295122

Asyncval:トレーニング中の高密度検索者チェックポイントを非同期的に検証するためのツールキット【JST・京大機械翻訳】

Asyncval: A Toolkit for Asynchronously Validating Dense Retriever Checkpoints during Training
著者 (2件):
資料名:
発行年: 2022年02月25日  プレプリントサーバーでの情報更新日: 2022年04月26日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
モデルチェックポイント検証のプロセスは,モデルのハイパーパラメータを学習しながら,訓練データの開催部分上で実行されるモデルチェックポイントの性能の評価を指し,また,モデルが訓練を停止するように収束する時,過剰適合を避けて,決定するために使用する。深層学習チェックポイントを検証する簡単で効率的な戦略は,訓練中に実行するための検証ループの追加である。しかし,高密度検索者(DR)チェックポイントの検証は自明ではなく,検証ループの追加は効率的でない。これは,DRチェックポイントの性能を正確に評価するため,チェックポイント検証のための実際の検索操作の前に,全文書コーパスを現在のチェックポイントを用いてベクトルに符号化する必要がある。このコーパス符号化プロセスは,文書コーパスが数百万の文書(例えば,MSMARCOに対して8.8m,自然質問に対して21m)を含むならば,非常に時間がかかる。したがって,訓練中の検証ループのナイーブな使用は訓練時間を著しく増加させる。この問題に取り組むため,本論文では,訓練中のDRチェックポイントを効率的に検証するためのPythonベースツールキットを提案する。DRチェックポイントの検証のために訓練ループを休止する代わりに,Asyncvalは訓練ループから検証ループを分離し,他のGPUを用いて新しいDRチェックポイントを自動的に検証して,訓練から非同期的に検証を行うことができた。また,Asyncvalは,DRチェックポイントを検証するために,異なるコーパスサブセットサンプリング戦略の範囲を実行する。これらの戦略は,検証プロセスをさらにスピードアップすることを可能にする。検証時間と検証忠実度への影響に関して,これらの方法の調査を提供した。https://github.com/ielab/asyncvalでのオープンソースプロジェクトとしてアシンバルが利用できる。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
その他のディジタル計算機方式  ,  ディジタル計算機方式一般 

前のページに戻る