文献
J-GLOBAL ID:200902224029243554   整理番号:09A0818504

接尾辞情報を利用した文書からの組織名抽出

Applying Suffix Rules to Organization Name Recognition
著者 (5件):
資料名:
巻: 24  号:ページ: 469-478 (J-STAGE)  発行年: 2009年 
JST資料番号: U0128A  ISSN: 1346-8030  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
テキストデータから組織名などの固有表現を抽出する技術では固有表現と,固有表現クラスの対をリストアップした固有表現辞書が整備・利用されてきた。一方,入力単語列から抜き出した各名詞列と各辞書エントリを比較し,照合する最長エントリから辞書知識を素性情報として取り込む方法(単純照合法)でしか利用がなされていない。本論文では,辞書知識を汎化させて辞書エントリ群から正規表現規則を自動生成し,活用する方法を検討した。まず,辞書エントリを構成する各部分単語系列の中で頻出する部分系列を残し,その他の部分系列を正規表現記号で置き換える。次に,固有表現が持つ表現上の構成的特徴に基づき,固有表現のクラス指定部となる接尾辞文字列を持たないものを正規表現規則から削除する。得られた正規表現規則を構成単語数が2以上の単語列と照合すると,従来は固有表現でないと判断されてしまう入力系列に固有表現の要素としての素性を付与できる。実際に人手でタグ付けされた固有表現データを用いて組織名を抽出する評価実験を行ったところ,単純照合法よりも抽出精度が向上し,単純照合法よりも小さな辞書で同等の性能を達成できることが確かめられた。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
数理言語学  ,  人工知能  ,  記号処理 
引用文献 (28件):
  • [浅原 04] 浅原 正幸, 松本 裕治:日本語固有表現抽出におけるわかち書き問題の解決, 情報処理学会論文誌, Vol.45, No.5, pp.1442--1450 (2004)
  • [Borthwick 98] Borthwick, A., Sterling, J., Agichtein, E., and Grishman, R.: Exploiting diverse knowledge sources via maximum entropy in named entity recognition, in Proc. of the 6th Workshop on Very Large Corpora, pp.152--160 (1998)
  • [Chinchor 92] hinchor, N.: The statistical significance of the MUC-4 results, in Proceedings of the 4th conference on message understanding, pp.30--50 (1992)
  • [Cohen 04] Cohen, W. and Sarawagi, S.: Exploiting dictionaries in named entity extraction: Combining semi-markov extraction processes and data integration methods, in Proc. of the 10th ACM SIGKDD (2004)
  • [Collins 02] Collins, M.: Ranking Algorithms for Named-Entity Extraction: Boosting and the Voted Perceptron, in Proc. of the 40th Annual Meeting of the Association for Computational Linguistics, pp.489--496 (2002)
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る