文献
J-GLOBAL ID:200902248769589973   整理番号:09A0033382

ラベルなしデータを用いた素性増強による日本語固有表現抽出方法

Japanese Named Entity Extraction by Augmenting Features with Unlabeled Data
著者 (2件):
資料名:
巻: 49  号: 10  ページ: 3657-3669  発行年: 2008年10月15日 
JST資料番号: Z0778B  ISSN: 1882-7837  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,日本語固有表現抽出における精度改善のための手法を提案する。日本語の固有表現抽出においては,単語の明確な境界がないために,単語認識を行った後に抽出を行う方法が幅広く用いられている。しかし,この方法では,単語の一部だけが固有表現を構成しうるという問題が生じる。この問題に対し,本論文では,単語単位の固有表現抽出の後に,文字単位の固有表現抽出を行う2段階の抽出手法を提案する。続いて,従来の固有表現抽出で幅広く利用されてきた,人手で作成された固有名詞辞書やシソーラスの代わりに,複数の固有表現抽出器でラベルなしデータを解析した結果から各単語がなりうる固有表現クラスや各単語と共起する固有表現クラスなどを獲得し,固有表現抽出の手がかりとして利用する方法を提案する。本手法を,IREXの固有表現抽出タスクにおいて評価を行った。その結果,単語単位と文字単位の抽出の組合せおよび,ラベルなしデータの利用が,日本語固有表現抽出の精度改善につながることが示せた。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理 
引用文献 (33件):
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る