抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
大規模で強力な神経言語モデルが開発されているので,研究者は,それらをプローブする診断ツールの開発においてますます興味が持たれている。形状「観測X」の結論を持つ多くの論文が,異なるサイズを有するそれら自身のデータセットを用いて,モデルYで見つかる。より大きなプロービングデータセットは,より多くの信頼性をもたらすが,収集するには高価である。合理的なプロービングデータセットサイズを推定するための定量的方法はまだない。2つのプロービング構成の比較の文脈でこの省略に取り組む:パイロット研究からの小さなデータセットを集めた後,多くの追加データサンプルが2つの異なる構成を区別するのに十分である。そのような実験におけるデータサンプルの必要な数を推定する新しい方法を示し,いくつかの事例研究を通して,著者らの推定が十分な統計的力を持つことを検証した。本フレームワークは,神経NLPモデルを診断するためのプロービングデータセットを系統的に構築するのに役立つ。【JST・京大機械翻訳】