文献
J-GLOBAL ID:201102246365990211   整理番号:11A0810556

グラフカーネルを用いた非分かち書き文からの漸次的語彙知識獲得

Bootstrapping Lexical Knowledge from Unsegmented Text using Graph Kernels
著者 (3件):
資料名:
巻: 26  号:ページ: 440-450 (J-STAGE)  発行年: 2011年 
JST資料番号: U0128A  ISSN: 1346-8030  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ブートストラップを用いた語彙関係獲得法の一種としてEspressoアルゴリズムは文の分かち書きを前提とし,少数の教師データ(シード)として単語のペアを与える。本論文では,日本語の非分かち書き文から意味カテゴリを直接抽出するために同じ意味カテゴリに属する単語の集合をシードとし,それらに隣接する文字nグラムをパターンとして用いるMonakaアルゴリズムを提案した。本手法では「信頼度の高いインスタンスは信頼度がともに高い右側文脈と左側文脈に挟まれる」という両側隣接制約を導入し,信頼度の上位において100%近い精度で正しく分かち書きされたインスタンスを抽出する。一方,他の多くのインスタンスと共起するパターンを抽出するとシードと関連性の低いインスタンスが抽出される(意味ドリフト)ので,小町らによるブートストラップ法のグラフ理論的解釈について検討した。具体的には,文字nグラムの隣接関係を有向グラフによって表現し,引用解析手法の1つであるグラフカーネルを適用してnグラム間の類似関係をもとに意味カテゴリを抽出するg-Monakaアルゴリズムを提案した。評価実験では意味ドリフトを抑えながら,分かち書きの正しいインスタンスを抽出できることが確かめられた。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
情報加工一般  ,  自然語処理  ,  グラフ理論基礎 
引用文献 (32件):
  • [Agichtein 00] Agichtein, E. and Gravano, L.: Snowball: Extracting Relations from Large Plain-Text Collections, Proceedings of the 5th ACM International Conference on Digital Libraries, pp. 85-94 (2000)
  • [Brin 98a] Brin, S.: Extracting Patterns and Relations from the World Wide Web, Proceedings of WebDB Workshop at 6th International Conference on Extending Database Technology, pp. 172-183 (1998)
  • [Brin 98b] Brin, S. and Page, L.: The Anatomy of a Large-Scale Hypertextual Web Search Engine, Proceedings of the seventh international conference on World Wide Web, pp. 107-117 (1998)
  • [Collins 99] Collins, M. and Singer, Y.: Unsupervised Models for Named Entity Classification, Proceedings of the Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora, pp. 100-110 (1999)
  • [Etzioni 04] Etzioni, O., Cafarella, M., Downey, D., Kok, S., Popescu, A.-M., Shaked, T., Soderland, S., Weld, D., and Yates, A.: Web-scale Information Extraction in KnowItAll: (Preliminary Results), Proceedings of the 13th international conference on World Wide Web, pp. 100-110 (2004)
もっと見る

前のページに戻る