特許
J-GLOBAL ID:200903098442294912
文書集計方法及び装置並びにそれらに用いるプログラムを記憶した媒体
発明者:
,
,
出願人/特許権者:
代理人 (2件):
作田 康夫
, 井上 学
公報種別:公開公報
出願番号(国際出願番号):特願2004-006217
公開番号(公開出願番号):特開2005-202535
出願日: 2004年01月14日
公開日(公表日): 2005年07月28日
要約:
【課題】専門的または普遍的な観点でトップダウンに軸の作成を行う従来手法に対して、本発明はあらかじめ観点を設定せずに、膨大な文書データからボトムアップに軸を作成することを支援し、さらに、その作業の過程において利用者が分析の観点を発見することを支援する。【解決手段】(1)システムがカテゴリに対応する検索式の候補(カテゴリ候補と呼ぶ)を抽出し、利用者が適切なものを選択する。(2)システムは、利用者が選択したカテゴリ候補から、軸を生成する。(3)利用者が軸の名前(すなわち分析の観点名)を決めるというステップのうち(1)のステップを支援する。すなわち、利用者が単にカテゴリ候補をすべて手作業で選択するのではなく、適切な数のカテゴリ候補を選択した時点で、システムがそれらの意味的あるいは概念的な特徴を学習して、類似した特徴を持つカテゴリ候補を自動的に抽出して画面に表示する。【選択図】図1
請求項(抜粋):
複数の文書を格納するデータベースと、演算部と、表示部と、ユーザ入力装置とを有するテキストマイニングシステムにおいて、上記複数の文書を複数カテゴリに分類して集計する文書集計のために該複数カテゴリを含む文書集計軸を作成する文書集計支援方法であって、
上記表示部に、上記データベースに格納された上記複数の文書から抽出される複数の抽出タームを表示し
上記ユーザ入力装置において上記表示した抽出タームの少なくとも一部を選択する第1のユーザ入力を受け付け、
上記選択された抽出タームの共起語を上記複数の文書から抽出して複数のカテゴリ候補として該複数のカテゴリ候補の上記抽出タームとの共起の強さを評価し、
上記表示部に上記複数のカテゴリ候補の少なくとも一部を、上記共起の強さに応じた順序で表示し、
上記ユーザ入力装置において上記表示したカテゴリ候補の少なくとも一部を選択する第2のユーザ入力を受け付け、
上記演算部において、上記第1のユーザ入力に基づいて該選択されたカテゴリ候補をカテゴリとして決定し、該カテゴリを用いて文書集計軸を作成することを特徴とする文書集計支援方法。
IPC (2件):
FI (3件):
G06F17/30 220Z
, G06F17/30 170A
, G06F19/00 130
Fターム (3件):
5B075ND03
, 5B075NS10
, 5B075UU06
引用特許:
出願人引用 (3件)
審査官引用 (8件)
全件表示
引用文献:
前のページに戻る