Pat
J-GLOBAL ID:200903079624642245

テキストマイニング方法

Inventor:
Applicant, Patent owner:
Agent (1): 作田 康夫
Gazette classification:公開公報
Application number (International application number):2000379770
Publication number (International publication number):2002183175
Application date: Dec. 08, 2000
Publication date: Jun. 28, 2002
Summary:
【要約】【課題】語の共起情報を用いることにより、テキストマイニングを高精度に行う。【解決手段】複数のテキストからなるコーパスを各テキストに付与された属性を用いて複数のサブコーパスに分割し、各サブコーパスを特徴付ける情報を抽出するテキストマイニング方法において、近傍に出現する語の組からなる語の共起を用いることによって、各サブコーパスを特徴付ける情報を高精度かつ簡便に抽出することができる。
Claim (excerpt):
少なくとも2個以上の文書集合から特徴的な情報を抽出するテキストマイニング方法において、前記2個以上の文書集合から同時に出現する語の組を抽出し、前記部分文書集合毎に前記抽出された語の組の中から特徴的な語の組を抽出することを特徴とするテキストマイニング方法。
IPC (3):
G06F 17/30 220 ,  G06F 17/30 170 ,  G06F 17/30 210
FI (3):
G06F 17/30 220 Z ,  G06F 17/30 170 A ,  G06F 17/30 210 D
F-Term (5):
5B075ND03 ,  5B075NK39 ,  5B075NR12 ,  5B075PQ02 ,  5B075PR04
Article cited by the Patent:
Return to Previous Page