プロービングのデータ要求について【JST・京大機械翻訳】

Zhu Zining; Wang Jixuan; Li Bai; Rudzicz Frank

プレプリント

J-GLOBAL ID：202202212201638935 整理番号：22P0295413

プロービングのデータ要求について【JST・京大機械翻訳】

On the data requirements of probing

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2022年02月25日プレプリントサーバーでの情報更新日： 2022年02月25日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

大規模で強力な神経言語モデルが開発されているので,研究者は,それらをプローブする診断ツールの開発においてますます興味が持たれている。形状「観測X」の結論を持つ多くの論文が,異なるサイズを有するそれら自身のデータセットを用いて,モデルYで見つかる。より大きなプロービングデータセットは,より多くの信頼性をもたらすが,収集するには高価である。合理的なプロービングデータセットサイズを推定するための定量的方法はまだない。2つのプロービング構成の比較の文脈でこの省略に取り組む:パイロット研究からの小さなデータセットを集めた後,多くの追加データサンプルが2つの異なる構成を区別するのに十分である。そのような実験におけるデータサンプルの必要な数を推定する新しい方法を示し,いくつかの事例研究を通して,著者らの推定が十分な統計的力を持つことを検証した。本フレームワークは,神経NLPモデルを診断するためのプロービングデータセットを系統的に構築するのに役立つ。【JST・京大機械翻訳】

, , , , , ,
, , 【Automatic Indexing@JST】

システム・制御理論一般 , 湖沼学,河川学 , 人工知能 , アルカロイドし好飲料 , パターン認識

前のページに戻る