プレプリント
J-GLOBAL ID:202202203453679244   整理番号:22P0141557

英語Devの使用:文脈埋込みのゼロショットクロス言語評価について【JST・京大機械翻訳】

Don't Use English Dev: On the Zero-Shot Cross-Lingual Evaluation of Contextual Embeddings
著者 (4件):
資料名:
発行年: 2020年04月30日  プレプリントサーバーでの情報更新日: 2020年10月06日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
マルチ言語文脈埋込みは,ゼロショット交差言語転送学習において最先端の性能を実証し,そこでは多言語BERTが1つのソース言語上で微調整され,異なるターゲット言語上で評価された。しかし,mBERTゼロショット精度に対する公表結果は,4つの論文にわたってMLDoc分類タスクに関して17ポイントと大きく変化した。ゼロショット設定におけるモデル選択のための英語デv精度を用いる標準実践は,MLDocとXNLIタスクに関する再現可能な結果を得ることを困難にする。英語のdev精度は,しばしば,ターゲット言語精度による非相関(または,反相関)であり,そして,ゼロショット性能は,同じ微調整ランと,異なる微調整ランの間で,異なる点で大いに変化した。これらの再現性問題は,異なる事前訓練埋込み(例えば,XLM-RによるMLQA)による他のタスクに対しても存在する。ゼロショット結果とともにオラクルスコアの提供を推薦する:英語データを使用するが,ターゲットデvセットでチェックポイントを選択する。この上限の報告は,任意に悪いチェックポイントを避けることにより,より一貫した結果をもたらす。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る