CrossNER:クロスドメイン名前付きエンティティ認識の評価【JST・京大機械翻訳】

Liu Zihan; Xu Yan; Yu Tiezheng; Dai Wenliang; Ji Ziwei; Cahyawijaya Samuel; Madotto Andrea; Fung Pascale

プレプリント

J-GLOBAL ID：202202205566994050 整理番号：22P0216187

CrossNER:クロスドメイン名前付きエンティティ認識の評価【JST・京大機械翻訳】

CrossNER: Evaluating Cross-Domain Named Entity Recognition

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (8件)： , , , , , , ,
資料名：
発行年： 2020年12月08日プレプリントサーバーでの情報更新日： 2020年12月13日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

エンティティ認識(NER)モデルと呼ばれるクロスドメインは,ターゲットドメインにおけるNERサンプルの不足問題に対処することができる。しかしながら,既存のNERベンチマークの大部分はドメインに専門化されたエンティティタイプを欠いているか,あるいはあるドメインに焦点を置かず,より効果的な交差ドメイン評価をもたらす。これらの障害に取り組むために,異なるドメインに対する特殊化された実体カテゴリーを持つ5つの多様なドメインにわたるNERデータの完全に標識された収集である,交差ドメインNERデータセット(CrossNER)を導入した。さらに,事前訓練言語モデル(ドメイン適応予訓練)をドメイン適応に対して効果的であるため,ドメイン関連コーパスも提供する。次に,交差ドメインタスクのためのドメイン適応予訓練を行うためのドメインコーパスと事前訓練戦略の異なるレベルを活用することの有効性を探索するために,包括的な実験を行った。結果は,ドメイン特殊化エンティティを含む分数コーパスに焦点を合わせ,ドメイン適応予訓練におけるより挑戦的な事前訓練戦略を利用することは,NERドメイン適応にとって有益であり,提案手法は,既存の交差ドメインNERベースラインを一貫して凌ぐことを示した。それにもかかわらず,この交差ドメインNERタスクの課題も例証した。データセットとベースラインがNERドメイン適応領域における研究を触媒することを期待する。コードとデータはhttps://github.com/zliucr/CrossNERで利用可能である。【JST・京大機械翻訳】

, , , , , , , ,
, 【Automatic Indexing@JST】

人工知能 , 分子・遺伝情報処理

, , ,

前のページに戻る