文献
J-GLOBAL ID:201302232919882053   整理番号:13A1017663

二段階クラスタリングを単語重み付与に応用した人名曖昧性解消

著者 (5件):
資料名:
巻:号:ページ: 19-24  発行年: 2010年11月26日 
JST資料番号: L5754A  ISSN: 1883-1060  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文はWeb検索における人名曖昧性解消のために,新たに二段階クラスタリング法を提案した。提案方式はアルゴリズムを通じて有用な単語(素性)に高い重み(信頼度)を与え,手がかりとして用いる手法である。そのために,固有名詞等の特徴量を用いた「強い素性」を利用して第1段階クラスタ(文書のまとまり)を生成し,この結果を利用してクラスタの重みを単語に伝播させて一般の単語の「弱い素性」に重みをTF-IDFで設定した。この重み付けした単語を用いて第2段階クラスタを生成した。実験は人名検索に関する公式データセットを用いて行った。その結果,提案方式は比較した方式と比べても同等か,より高い性能を示すことを確認した。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理 
引用文献 (22件):
  • [1] E. Amigo, J. Gonzalo, J. Artiles, and F. Verdejo. A com- parison of extrinsic clustering evaluation metrics based on formal constraints. Information Retrieval, 12(4), 2009.
  • [2] J. Artiles, J. Gonzalo, and S. Sekine. The SemEval- 2007 WePS evaluation: Establishing a benchmark for the web people search task. In SemEval-2007, pages 64-69, 2007.
  • [3] J. Artiles, J. Gonzalo, and S. Sekine. WePS 2 Eval- uation Campaign: overview of the Web People Search Clustering Task. In 2nd Web People Search Evaluation Workshop (WePS 2009), 2009.
  • [4] A. Bagga and B. Baldwin. Entity-based cross-document coreferencing using the vector space model. In COLING-ACL 1998, pages 79-85, 1998.
  • [5] K. Balog, L. Azzopardi, and M. Rijke. Personal name resolution of web people search. In NLPIX 2008, 2008.
もっと見る

前のページに戻る