特許
J-GLOBAL ID:200903029448249569

文書処理方法及び装置並びにその処理プログラムを記憶した媒体

発明者:
出願人/特許権者:
代理人 (1件): 作田 康夫
公報種別:公開公報
出願番号(国際出願番号):特願2000-142231
公開番号(公開出願番号):特開2001-318939
出願日: 2000年05月09日
公開日(公表日): 2001年11月16日
要約:
【要約】【課題】多種多様な視点から文書(テキスト)を分析することが可能なテキストマイニング方法を提供することにある。【解決手段】予め登録された文書の集合を対象として、その全体または一部分を取り出した処理対象文書集合に特徴的に出現する語句を抽出する特徴語句抽出ステップと、指定された語句または書誌情報を含む定義情報を設定する定義情報設定ステップと、該特徴語句抽出ステップで抽出した語句の中から該定義情報に含まれる語句または書誌情報と予め定められた範囲内で共起する共起語句を取得する共起語句取得ステップを有するテキストマイニング方法において、複数の異なる定義情報を有し、該複数の定義情報の各々から取得した個々の語句または書誌情報と予め定められた範囲内で共起する共起語句を取得する多重共起語句取得ステップを有する。
請求項(抜粋):
予め登録された文書の集合を対象として、その全体または一部分を取り出した処理対象文書集合に特徴的に出現する語句を抽出する特徴語句抽出ステップと、指定された語句または書誌情報を含む定義情報を設定する定義情報設定ステップと、該特徴語句抽出ステップで抽出した語句の中から該定義情報に含まれる語句または書誌情報と予め定められた範囲内で共起する共起語句を取得する共起語句取得ステップを有するテキストマイニング方法において、複数の異なる定義情報を有し、該複数の定義情報の各々から取得した個々の語句または書誌情報と予め定められた範囲内で共起する共起語句を取得する多重共起語句取得ステップを有することを特徴としたテキストマイニング方法。
IPC (3件):
G06F 17/30 220 ,  G06F 17/30 170 ,  G06F 17/30 330
FI (3件):
G06F 17/30 220 Z ,  G06F 17/30 170 A ,  G06F 17/30 330 C
Fターム (6件):
5B075ND03 ,  5B075NK32 ,  5B075NK39 ,  5B075NS01 ,  5B075PP24 ,  5B075QP05
引用特許:
審査官引用 (1件)
  • 情報探索装置
    公報種別:公開公報   出願番号:特願平8-021471   出願人:富士ゼロックス株式会社

前のページに戻る