Pat
J-GLOBAL ID:200903029448249569

文書処理方法及び装置並びにその処理プログラムを記憶した媒体

Inventor:
Applicant, Patent owner:
Agent (1): 作田 康夫
Gazette classification:公開公報
Application number (International application number):2000142231
Publication number (International publication number):2001318939
Application date: May. 09, 2000
Publication date: Nov. 16, 2001
Summary:
【要約】【課題】多種多様な視点から文書(テキスト)を分析することが可能なテキストマイニング方法を提供することにある。【解決手段】予め登録された文書の集合を対象として、その全体または一部分を取り出した処理対象文書集合に特徴的に出現する語句を抽出する特徴語句抽出ステップと、指定された語句または書誌情報を含む定義情報を設定する定義情報設定ステップと、該特徴語句抽出ステップで抽出した語句の中から該定義情報に含まれる語句または書誌情報と予め定められた範囲内で共起する共起語句を取得する共起語句取得ステップを有するテキストマイニング方法において、複数の異なる定義情報を有し、該複数の定義情報の各々から取得した個々の語句または書誌情報と予め定められた範囲内で共起する共起語句を取得する多重共起語句取得ステップを有する。
Claim (excerpt):
予め登録された文書の集合を対象として、その全体または一部分を取り出した処理対象文書集合に特徴的に出現する語句を抽出する特徴語句抽出ステップと、指定された語句または書誌情報を含む定義情報を設定する定義情報設定ステップと、該特徴語句抽出ステップで抽出した語句の中から該定義情報に含まれる語句または書誌情報と予め定められた範囲内で共起する共起語句を取得する共起語句取得ステップを有するテキストマイニング方法において、複数の異なる定義情報を有し、該複数の定義情報の各々から取得した個々の語句または書誌情報と予め定められた範囲内で共起する共起語句を取得する多重共起語句取得ステップを有することを特徴としたテキストマイニング方法。
IPC (3):
G06F 17/30 220 ,  G06F 17/30 170 ,  G06F 17/30 330
FI (3):
G06F 17/30 220 Z ,  G06F 17/30 170 A ,  G06F 17/30 330 C
F-Term (6):
5B075ND03 ,  5B075NK32 ,  5B075NK39 ,  5B075NS01 ,  5B075PP24 ,  5B075QP05
Patent cited by the Patent:
Cited by examiner (1)
  • 情報探索装置
    Gazette classification:公開公報   Application number:特願平8-021471   Applicant:富士ゼロックス株式会社

Return to Previous Page