抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,日本語固有表現抽出における精度改善のための手法を提案する。日本語の固有表現抽出においては,単語の明確な境界がないために,単語認識を行った後に抽出を行う方法が幅広く用いられている。しかし,この方法では,単語の一部だけが固有表現を構成しうるという問題が生じる。この問題に対し,本論文では,単語単位の固有表現抽出の後に,文字単位の固有表現抽出を行う2段階の抽出手法を提案する。続いて,従来の固有表現抽出で幅広く利用されてきた,人手で作成された固有名詞辞書やシソーラスの代わりに,複数の固有表現抽出器でラベルなしデータを解析した結果から各単語がなりうる固有表現クラスや各単語と共起する固有表現クラスなどを獲得し,固有表現抽出の手がかりとして利用する方法を提案する。本手法を,IREXの固有表現抽出タスクにおいて評価を行った。その結果,単語単位と文字単位の抽出の組合せおよび,ラベルなしデータの利用が,日本語固有表現抽出の精度改善につながることが示せた。(著者抄録)