特許
J-GLOBAL ID:200903058645819598

文書分類装置

発明者:
出願人/特許権者:
代理人 (1件): 川口 義雄 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-259809
公開番号(公開出願番号):特開平7-114572
出願日: 1993年10月18日
公開日(公表日): 1995年05月02日
要約:
【要約】【目的】 文書から自動的に単語の特徴ベクトルを抽出し、その特徴ベクトルをもとに文書を分類することで、意味的な異なりを用いた自動分類を可能にする。【構成】 文書分類装置において、文書データを記憶する記憶部101と、文書データを解析する文書解析部102と、文書中の単語間の共起関係を用いて各単語の特徴を表現する特徴ベクトルを自動的に生成する単語ベクトル生成部103と、その特徴ベクトルを記憶する単語ベクトル記憶部104と、文書内に含まれている単語の特徴ベクトルから文書の特徴ベクトルを生成する文書ベクトル生成部105と、その特徴ベクトルを記憶する文書ベクトル記憶部106と、文書の特徴ベクトル間の類似度を利用して文書を分類する分類部107と、その分類した結果を記憶する結果記憶部108と、特徴ベクトル生成時に使用する単語が登録されている特徴ベクトル生成用辞書109を備える。
請求項(抜粋):
文書分類装置において、文書データを記憶する記憶部と、文書データを解析する文書解析部と、文書中の単語間の共起関係を用いて各単語の特徴を表現する特徴ベクトルを自動的に生成する単語ベクトル生成部と、その特徴ベクトルを記憶する単語ベクトル記憶部と、文書内に含まれている単語の特徴ベクトルから文書の特徴ベクトルを生成する文書ベクトル生成部と、その特徴ベクトルを記憶する文書ベクトル記憶部と、文書の特徴ベクトル間の類似度を利用して文書を分類する分類部と、その分類した結果を記憶する結果記憶部と、特徴ベクトル生成時に使用する単語が登録されている特徴ベクトル生成用辞書とを備え、大量の文書ファイル中の単語間の共起関係を用いて、各単語の特徴を表現する特徴ベクトルを自動的に生成し、文書を自動的に分類することができることを特徴とする文書分類装置。
IPC (2件):
G06F 17/30 ,  G06F 17/27
FI (2件):
G06F 15/401 310 D ,  G06F 15/20 550 F

前のページに戻る