文献
J-GLOBAL ID:200902211927036943   整理番号:09A0531076

社会課題発見のための文書クラスタリングとクラスタ評価指標

Document Clustering for Social Problem Detection and Cluster Evaluation Measures
著者 (5件):
資料名:
巻: 24  号:ページ: 333-338 (J-STAGE)  発行年: 2009年 
JST資料番号: U0128A  ISSN: 1346-8030  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
社会課題発見支援システムRiverStoneでは,1)文書検索,2)文書クラスタリング,3)文書要約によって新聞記事の俯瞰的分析を支援する。本論文では,科学計量学で見出されたクラスタ内部の語の共起関係の強さを示す指標(密度),及び当該クラスタと他のクラスタの共起関係の強さを示す指標(中心度)を2)に適合するように定式化し,クラスタの位置付けの判別に利用した。2)ではクラスタリング結果をデンドログラムとして可視化できる階層的ハードクラスタリングを用い,i)凝集型階層的クラスタリングとして非加重結合法,ii)分割型階層的クラスタリングとしてk-平均法の再帰的適用を行った。また,分析対象の文書はTF-IDF(Tern Frequency-Inverse Document Frequency)をベースとして語の頻度,文字列長,出現位置を考慮した文書ベクトルを用いて表した。実際に「事件,事故,災害」に関連した新聞記事の検索結果を階層的に11のカテゴリに分類し,密度や中心度に基づくクラスタ評価を行ったところ,分析に有効な文書を効率的に選別できることなどが確かめられた。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  システム・制御理論一般  ,  図形・画像処理一般 
引用文献 (11件):
  • [Callon 91] Callon, M., Courtial, J. P., and Laville, F.: Co-word Analysis as a Tool for Describing The Netword of Interactions Between Basic and Technological Research: The Case of Polymer Chemistry, Sientometrics, Vol. 22, pp. 155?205 (1991)
  • [Karypis 03] Karypis, G.: CLUTO A Clustering Toolkit Release2.1.1, University of Minnesota, Department of Computer Sciense (2003), http://glaros.dtc.umn.edu/gkhome/cluto/cluto/overview
  • [Matsumoto 99] Matsumoto, Y., Kitauchi, A., Yamashita, T., Hirano, Y., Matsuda, H., and Asahara, M.: Japanese Morphological Analyzer ChaSen Users Manual version 2.0., Technical Report Technical Report NAIST-IS-TR990123, Nara Institute of Science and Technology (1999)
  • [Savaresi 01] Savaresi, S. M. and Boley, D. L.: On the performance of bisecting k-means and PDDP, in First SIAM International Conference on Data Mining, pp. 1?14 (2001)
  • [Zhao 03] Zhao, Y. and Karypis, G.: Criterion Function for Document Clustering, Technical report, Department of Computer Science, University of Minnesota, Minneapolis, MN 55455 (2003)
もっと見る

前のページに戻る