Pat
J-GLOBAL ID:200903098442294912

文書集計方法及び装置並びにそれらに用いるプログラムを記憶した媒体

Inventor:
Applicant, Patent owner:
Agent (2): 作田 康夫 ,  井上 学
Gazette classification:公開公報
Application number (International application number):2004006217
Publication number (International publication number):2005202535
Application date: Jan. 14, 2004
Publication date: Jul. 28, 2005
Summary:
【課題】専門的または普遍的な観点でトップダウンに軸の作成を行う従来手法に対して、本発明はあらかじめ観点を設定せずに、膨大な文書データからボトムアップに軸を作成することを支援し、さらに、その作業の過程において利用者が分析の観点を発見することを支援する。【解決手段】(1)システムがカテゴリに対応する検索式の候補(カテゴリ候補と呼ぶ)を抽出し、利用者が適切なものを選択する。(2)システムは、利用者が選択したカテゴリ候補から、軸を生成する。(3)利用者が軸の名前(すなわち分析の観点名)を決めるというステップのうち(1)のステップを支援する。すなわち、利用者が単にカテゴリ候補をすべて手作業で選択するのではなく、適切な数のカテゴリ候補を選択した時点で、システムがそれらの意味的あるいは概念的な特徴を学習して、類似した特徴を持つカテゴリ候補を自動的に抽出して画面に表示する。【選択図】図1
Claim (excerpt):
複数の文書を格納するデータベースと、演算部と、表示部と、ユーザ入力装置とを有するテキストマイニングシステムにおいて、上記複数の文書を複数カテゴリに分類して集計する文書集計のために該複数カテゴリを含む文書集計軸を作成する文書集計支援方法であって、 上記表示部に、上記データベースに格納された上記複数の文書から抽出される複数の抽出タームを表示し 上記ユーザ入力装置において上記表示した抽出タームの少なくとも一部を選択する第1のユーザ入力を受け付け、 上記選択された抽出タームの共起語を上記複数の文書から抽出して複数のカテゴリ候補として該複数のカテゴリ候補の上記抽出タームとの共起の強さを評価し、 上記表示部に上記複数のカテゴリ候補の少なくとも一部を、上記共起の強さに応じた順序で表示し、 上記ユーザ入力装置において上記表示したカテゴリ候補の少なくとも一部を選択する第2のユーザ入力を受け付け、 上記演算部において、上記第1のユーザ入力に基づいて該選択されたカテゴリ候補をカテゴリとして決定し、該カテゴリを用いて文書集計軸を作成することを特徴とする文書集計支援方法。
IPC (2):
G06F17/30 ,  G06F19/00
FI (3):
G06F17/30 220Z ,  G06F17/30 170A ,  G06F19/00 130
F-Term (3):
5B075ND03 ,  5B075NS10 ,  5B075UU06
Patent cited by the Patent:
Cited by applicant (3) Cited by examiner (8)
Show all
Article cited by the Patent:
Return to Previous Page