非話者アノテーションを用いた低リソースNERモデルの構築【JST・京大機械翻訳】

Tsygankova Tatiana; Marini Francesca; Mayhew Stephen; Roth Dan

プレプリント

J-GLOBAL ID：202202220242889554 整理番号：21P0035974

非話者アノテーションを用いた低リソースNERモデルの構築【JST・京大機械翻訳】

Building Low-Resource NER Models Using Non-Speaker Annotation

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2020年06月16日プレプリントサーバーでの情報更新日： 2021年04月26日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

低資源自然言語処理(NLP)において,重要問題は,目標言語訓練データの欠如であり,それを作成するためのネイティブ話者の欠如である。交差言語法は,これらの懸念に対処する際に顕著な成功を遂げたが,しかし,ソース言語から遠い事前訓練コーパスまたは言語のような,ある一般的な環境において,それらの性能は,悩ましかった。本研究では,ターゲット言語における事前経験のない注釈者により提供される,「ノン話者(NS)アノテーションを用いて,低資源Named Entity認識(NER)モデルを構築するための相補的アプローチを提案した。インドネシア,ロシア,およびHindiによる注意深く制御された注釈実験に30人の参加者を募集した。NS注釈器の使用は,現代の文脈表現で構築された交差言語法よりも一貫して,またはより良い結果を生成し,追加の努力で性能を上回る可能性を有することを示した。共通注釈パターンおよび推奨実装実践の観測で結論を下し,NSアノテーションが,より詳細,http://cogcomp.org/page/publication_view/941に対する改善性能のための事前方法に加えてどのように使用できるかを動機づけた。【JST・京大機械翻訳】

, , , ,
, , , 【Automatic Indexing@JST】

パターン認識 , 自然語処理 , 医用情報処理

, , ,

前のページに戻る