特許
J-GLOBAL ID:200903072885484340

文書分類方法および装置並びに文書分類処理プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 喜三郎 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-008017
公開番号(公開出願番号):特開平11-203318
出願日: 1998年01月19日
公開日(公表日): 1999年07月30日
要約:
【要約】【課題】 多数の文書を分類する際、文書内容全体から特徴要素を抽出してその特徴要素に基づいた分類を行うと分類結果が散漫なものとなる。【解決手段】 ユーザからの注目語を受け付ける注目語受け付け部2と、処理対象文書を解析し、前記注目語に基づいて注目語を含む文脈(注目文脈)を検出する文解析部3と、 注目文脈から特徴要素を抽出する特徴要素抽出部4と、前記注目文脈から抽出された特徴要素とその特徴要素を含む処理対象文書との関係を示す特徴テーブルを作成する特徴テーブル作成手段5、この特徴テーブルの内容を参照して前記処理対象文書を意味的に共通性のあるクラスタに分類する文書分類部6と、この文書分類部6により分類された内容を記憶する分類結果記憶部7と、この分類結果記憶部7の内容を読み出して出力する出力制御部8とを有する構成とする。
請求項(抜粋):
注目語が入力されると、複数の処理対象文書からその注目語を含む文脈を検出し、検出されたそれぞれの文脈から特徴要素を抽出し、その特徴要素とその特徴要素を含む処理対象文書との関係を示す特徴テーブルを作成して、その特徴テーブルに基づいて前記処理対象文書を意味的に共通性のあるクラスタに分類することを特徴とする文書分類方法。
IPC (2件):
G06F 17/30 ,  G06F 17/27
FI (2件):
G06F 15/401 310 D ,  G06F 15/38 D

前のページに戻る