Pat
J-GLOBAL ID:200903098442294912
文書集計方法及び装置並びにそれらに用いるプログラムを記憶した媒体
Inventor:
,
,
Applicant, Patent owner:
Agent (2):
作田 康夫
, 井上 学
Gazette classification:公開公報
Application number (International application number):2004006217
Publication number (International publication number):2005202535
Application date: Jan. 14, 2004
Publication date: Jul. 28, 2005
Summary:
【課題】専門的または普遍的な観点でトップダウンに軸の作成を行う従来手法に対して、本発明はあらかじめ観点を設定せずに、膨大な文書データからボトムアップに軸を作成することを支援し、さらに、その作業の過程において利用者が分析の観点を発見することを支援する。【解決手段】(1)システムがカテゴリに対応する検索式の候補(カテゴリ候補と呼ぶ)を抽出し、利用者が適切なものを選択する。(2)システムは、利用者が選択したカテゴリ候補から、軸を生成する。(3)利用者が軸の名前(すなわち分析の観点名)を決めるというステップのうち(1)のステップを支援する。すなわち、利用者が単にカテゴリ候補をすべて手作業で選択するのではなく、適切な数のカテゴリ候補を選択した時点で、システムがそれらの意味的あるいは概念的な特徴を学習して、類似した特徴を持つカテゴリ候補を自動的に抽出して画面に表示する。【選択図】図1
Claim (excerpt):
複数の文書を格納するデータベースと、演算部と、表示部と、ユーザ入力装置とを有するテキストマイニングシステムにおいて、上記複数の文書を複数カテゴリに分類して集計する文書集計のために該複数カテゴリを含む文書集計軸を作成する文書集計支援方法であって、
上記表示部に、上記データベースに格納された上記複数の文書から抽出される複数の抽出タームを表示し
上記ユーザ入力装置において上記表示した抽出タームの少なくとも一部を選択する第1のユーザ入力を受け付け、
上記選択された抽出タームの共起語を上記複数の文書から抽出して複数のカテゴリ候補として該複数のカテゴリ候補の上記抽出タームとの共起の強さを評価し、
上記表示部に上記複数のカテゴリ候補の少なくとも一部を、上記共起の強さに応じた順序で表示し、
上記ユーザ入力装置において上記表示したカテゴリ候補の少なくとも一部を選択する第2のユーザ入力を受け付け、
上記演算部において、上記第1のユーザ入力に基づいて該選択されたカテゴリ候補をカテゴリとして決定し、該カテゴリを用いて文書集計軸を作成することを特徴とする文書集計支援方法。
IPC (2):
FI (3):
G06F17/30 220Z
, G06F17/30 170A
, G06F19/00 130
F-Term (3):
5B075ND03
, 5B075NS10
, 5B075UU06
Patent cited by the Patent:
Cited by applicant (3)
-
文書群分析支援装置、方法、及び記録媒体
Gazette classification:公開公報
Application number:特願2000-083491
Applicant:株式会社リコー
-
データ表示方法及び装置並びにその処理プログラムを記憶した媒体
Gazette classification:公開公報
Application number:特願2001-042690
Applicant:株式会社日立製作所
-
テキストマイニング方法
Gazette classification:公開公報
Application number:特願2000-379770
Applicant:株式会社日立製作所
Cited by examiner (8)
-
データ表示方法及び装置並びにその処理プログラムを記憶した媒体
Gazette classification:公開公報
Application number:特願2001-042690
Applicant:株式会社日立製作所
-
ゴム製マスク型の感染予防口内サック
Gazette classification:公開公報
Application number:特願平4-360676
Applicant:渡邉優
-
特開平3-007151
-
特開昭48-104386
-
情報処理装置およびその方法
Gazette classification:公開公報
Application number:特願2001-333138
Applicant:日本ユニシス株式会社
-
文書群分析支援装置、方法、及び記録媒体
Gazette classification:公開公報
Application number:特願2000-083491
Applicant:株式会社リコー
-
辞書構築支援装置、辞書構築支援方法及び辞書構築支援プログラム
Gazette classification:公開公報
Application number:特願2001-371674
Applicant:株式会社東芝
-
テキストマイニング方法
Gazette classification:公開公報
Application number:特願2000-379770
Applicant:株式会社日立製作所
Show all
Article cited by the Patent:
Cited by examiner (5)
Show all
Return to Previous Page