Pat
J-GLOBAL ID:200903058645819598

文書分類装置

Inventor:
Applicant, Patent owner:
Agent (1): 川口 義雄 (外1名)
Gazette classification:公開公報
Application number (International application number):1993259809
Publication number (International publication number):1995114572
Application date: Oct. 18, 1993
Publication date: May. 02, 1995
Summary:
【要約】【目的】 文書から自動的に単語の特徴ベクトルを抽出し、その特徴ベクトルをもとに文書を分類することで、意味的な異なりを用いた自動分類を可能にする。【構成】 文書分類装置において、文書データを記憶する記憶部101と、文書データを解析する文書解析部102と、文書中の単語間の共起関係を用いて各単語の特徴を表現する特徴ベクトルを自動的に生成する単語ベクトル生成部103と、その特徴ベクトルを記憶する単語ベクトル記憶部104と、文書内に含まれている単語の特徴ベクトルから文書の特徴ベクトルを生成する文書ベクトル生成部105と、その特徴ベクトルを記憶する文書ベクトル記憶部106と、文書の特徴ベクトル間の類似度を利用して文書を分類する分類部107と、その分類した結果を記憶する結果記憶部108と、特徴ベクトル生成時に使用する単語が登録されている特徴ベクトル生成用辞書109を備える。
Claim (excerpt):
文書分類装置において、文書データを記憶する記憶部と、文書データを解析する文書解析部と、文書中の単語間の共起関係を用いて各単語の特徴を表現する特徴ベクトルを自動的に生成する単語ベクトル生成部と、その特徴ベクトルを記憶する単語ベクトル記憶部と、文書内に含まれている単語の特徴ベクトルから文書の特徴ベクトルを生成する文書ベクトル生成部と、その特徴ベクトルを記憶する文書ベクトル記憶部と、文書の特徴ベクトル間の類似度を利用して文書を分類する分類部と、その分類した結果を記憶する結果記憶部と、特徴ベクトル生成時に使用する単語が登録されている特徴ベクトル生成用辞書とを備え、大量の文書ファイル中の単語間の共起関係を用いて、各単語の特徴を表現する特徴ベクトルを自動的に生成し、文書を自動的に分類することができることを特徴とする文書分類装置。
IPC (2):
G06F 17/30 ,  G06F 17/27
FI (2):
G06F 15/401 310 D ,  G06F 15/20 550 F

Return to Previous Page