特許
J-GLOBAL ID:200903079624642245
テキストマイニング方法
発明者:
,
出願人/特許権者:
代理人 (1件):
作田 康夫
公報種別:公開公報
出願番号(国際出願番号):特願2000-379770
公開番号(公開出願番号):特開2002-183175
出願日: 2000年12月08日
公開日(公表日): 2002年06月28日
要約:
【要約】【課題】語の共起情報を用いることにより、テキストマイニングを高精度に行う。【解決手段】複数のテキストからなるコーパスを各テキストに付与された属性を用いて複数のサブコーパスに分割し、各サブコーパスを特徴付ける情報を抽出するテキストマイニング方法において、近傍に出現する語の組からなる語の共起を用いることによって、各サブコーパスを特徴付ける情報を高精度かつ簡便に抽出することができる。
請求項(抜粋):
少なくとも2個以上の文書集合から特徴的な情報を抽出するテキストマイニング方法において、前記2個以上の文書集合から同時に出現する語の組を抽出し、前記部分文書集合毎に前記抽出された語の組の中から特徴的な語の組を抽出することを特徴とするテキストマイニング方法。
IPC (3件):
G06F 17/30 220
, G06F 17/30 170
, G06F 17/30 210
FI (3件):
G06F 17/30 220 Z
, G06F 17/30 170 A
, G06F 17/30 210 D
Fターム (5件):
5B075ND03
, 5B075NK39
, 5B075NR12
, 5B075PQ02
, 5B075PR04
引用文献:
前のページに戻る