プレプリント
J-GLOBAL ID:202202212445965695   整理番号:22P0292306

MACRONYM:多言語および多領域匿名抽出のための大規模データセット【JST・京大機械翻訳】

MACRONYM: A Large-Scale Dataset for Multilingual and Multi-Domain Acronym Extraction
著者 (6件):
資料名:
発行年: 2022年02月19日  プレプリントサーバーでの情報更新日: 2022年02月19日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
匿名抽出は,様々なNLPアプリケーションに必要なテキストにおいて,匿名性とその拡張型を同定するタスクである。近年のこの課題の主要な進歩にもかかわらず,既存のAE研究の1つの限界は,それらが英語言語と特定の領域(すなわち,科学的と生物医学的)に限定されていることである。このように,他の言語とドメインにおけるAEの課題は,主に調査されていない。多重言語とドメインにおける注釈付きデータセットの欠落は,この領域における研究を妨げる主要な課題であった。この限界に対処するために,多言語マルチドメインAEのための新しいデータセットを提案した。特に,6つのトポロジー的に異なる言語と2つのドメイン,すなわち,Legalと科学における27,200の文章を,AEのために手動で注釈付けした。提案したデータセットに関する広範な実験は,異なる言語と異なる学習設定におけるAEがユニークな課題を持ち,多言語とマルチドメインAEに関する更なる研究の必要性を強調する。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  検索技術 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る