抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
エンティティ認識(NER)モデルと呼ばれるクロスドメインは,ターゲットドメインにおけるNERサンプルの不足問題に対処することができる。しかしながら,既存のNERベンチマークの大部分はドメインに専門化されたエンティティタイプを欠いているか,あるいはあるドメインに焦点を置かず,より効果的な交差ドメイン評価をもたらす。これらの障害に取り組むために,異なるドメインに対する特殊化された実体カテゴリーを持つ5つの多様なドメインにわたるNERデータの完全に標識された収集である,交差ドメインNERデータセット(CrossNER)を導入した。さらに,事前訓練言語モデル(ドメイン適応予訓練)をドメイン適応に対して効果的であるため,ドメイン関連コーパスも提供する。次に,交差ドメインタスクのためのドメイン適応予訓練を行うためのドメインコーパスと事前訓練戦略の異なるレベルを活用することの有効性を探索するために,包括的な実験を行った。結果は,ドメイン特殊化エンティティを含む分数コーパスに焦点を合わせ,ドメイン適応予訓練におけるより挑戦的な事前訓練戦略を利用することは,NERドメイン適応にとって有益であり,提案手法は,既存の交差ドメインNERベースラインを一貫して凌ぐことを示した。それにもかかわらず,この交差ドメインNERタスクの課題も例証した。データセットとベースラインがNERドメイン適応領域における研究を触媒することを期待する。コードとデータはhttps://github.com/zliucr/CrossNERで利用可能である。【JST・京大機械翻訳】