プレプリント
J-GLOBAL ID:202202220242889554   整理番号:21P0035974

非話者アノテーションを用いた低リソースNERモデルの構築【JST・京大機械翻訳】

Building Low-Resource NER Models Using Non-Speaker Annotation
著者 (4件):
資料名:
発行年: 2020年06月16日  プレプリントサーバーでの情報更新日: 2021年04月26日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
低資源自然言語処理(NLP)において,重要問題は,目標言語訓練データの欠如であり,それを作成するためのネイティブ話者の欠如である。交差言語法は,これらの懸念に対処する際に顕著な成功を遂げたが,しかし,ソース言語から遠い事前訓練コーパスまたは言語のような,ある一般的な環境において,それらの性能は,悩ましかった。本研究では,ターゲット言語における事前経験のない注釈者により提供される,「ノン話者(NS)アノテーションを用いて,低資源Named Entity認識(NER)モデルを構築するための相補的アプローチを提案した。インドネシア,ロシア,およびHindiによる注意深く制御された注釈実験に30人の参加者を募集した。NS注釈器の使用は,現代の文脈表現で構築された交差言語法よりも一貫して,またはより良い結果を生成し,追加の努力で性能を上回る可能性を有することを示した。共通注釈パターンおよび推奨実装実践の観測で結論を下し,NSアノテーションが,より詳細,http://cogcomp.org/page/publication_view/941に対する改善性能のための事前方法に加えてどのように使用できるかを動機づけた。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  自然語処理  ,  医用情報処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る