特許
J-GLOBAL ID:200903047696758621

文書分類装置及び文書分類方法

発明者:
出願人/特許権者:
代理人 (1件): 渡部 敏彦
公報種別:公開公報
出願番号(国際出願番号):特願平8-248522
公開番号(公開出願番号):特開平10-078971
出願日: 1996年09月02日
公開日(公表日): 1998年03月24日
要約:
【要約】【課題】 文書を文書ベクトルに基づいていずれかのカテゴリに分類する際に、1つのカテゴリのトレーニング文書の文書ベクトルの分布が小群に分けられる場合でも適切なカテゴリ範囲を決定することが可能な文書分類装置及び文書分類方法を提供する。【解決手段】 文書ベクトルを計算する文書ベクトル計算部104と、各カテゴリの文書ベクトルをその分布状況に応じてクラスタリングする文書ベクトルクラスタリング部106と、各クラスタの文書ベクトルの平均を計算する平均ベクトル計算部108と、各カテゴリの範囲を計算するカテゴリ範囲計算部110と、目的文書のカテゴリを決定するカテゴリ決定部113とを具備する。
請求項(抜粋):
分類対象となる目的文書とカテゴリが既知であるトレーニング文書とのそれぞれの文書内容を示す文書ベクトルに基づきカテゴリを決定する文書分類装置であって、指示入力されたトレーニング文書と分類対象となる目的文書を、トレーニング文書と目的文書が保存された文書データベース手段から取り出し、文書ベクトルを計算する文書ベクトル計算手段と、該文書ベクトル計算手段により計算されたトレーニング文書の文書ベクトルを参照し、各カテゴリの文書ベクトルをその分布状況に応じてクラスタリングする文書ベクトルクラスタリング手段と、前記文書ベクトル計算手段により計算されたトレーニング文書の文書ベクトルと前記文書ベクトルクラスタリング手段によりクラスタリングされたクラスタリング結果とを参照し、各クラスタの文書ベクトルの平均を計算する平均ベクトル計算手段と、前記文書ベクトル計算手段により計算されたトレーニング文書の文書ベクトルと前記文書ベクトルクラスタリング手段によりクラスタリングされたクラスタリング結果と前記平均ベクトル計算手段により計算された各クラスタの平均ベクトルとを参照し、各カテゴリの範囲を計算するカテゴリ範囲計算手段と、前記平均ベクトル計算手段により計算された各クラスタの平均ベクトルと前記カテゴリ範囲計算手段により計算された各カテゴリの範囲と前記文書ベクトル計算手段により計算された目的文書の文書ベクトルとを参照し、目的文書のカテゴリを決定するカテゴリ決定手段とを具備することを特徴とする文書分類装置。
FI (2件):
G06F 15/401 310 D ,  G06F 15/40 370 A

前のページに戻る