Pat
J-GLOBAL ID:200903047098471130
文書分類装置及び文書検索装置
Inventor:
Applicant, Patent owner:
Agent (1):
川口 義雄 (外1名)
Gazette classification:公開公報
Application number (International application number):1995151640
Publication number (International publication number):1997006799
Application date: Jun. 19, 1995
Publication date: Jan. 10, 1997
Summary:
【要約】【目的】 言語の種類を問わず、文書を分類したり検索したりすることができる装置を提供する。【構成】 文書分類装置において、文書データを記憶する文書記憶部101と、文書データを解析する文書解析部102と、文書中の概念識別子の特徴ベクトルを生成する概念ベクトル生成部103と、その特徴ベクトルを記憶する概念ベクトル記憶部104と、文書内に含まれている概念識別子の特徴ベクトルから文書の特徴ベクトルを生成する文書ベクトル生成部105と、その特徴ベクトルを記憶する文書ベクトル記憶部106と、文書特徴ベクトル間の類似度を利用して文書を分類する分類部107と、その分類した結果を記憶する結果記憶部108と、特徴ベクトル生成時に使用する単語や概念識別子が登録されている特徴ベクトル生成用辞書109とを備える。
Claim (excerpt):
文書の内容にしたがって文書の分類を行う文書分類装置であって、文書データを記憶する文書記憶部と、予め定められた単語及び概念識別子を登録した特徴ベクトル生成用辞書と、前記特徴ベクトル生成用辞書によって、記憶した文書データの単語を解析する文書解析部と、前記特徴ベクトル生成用辞書によって、文書データの単語を概念識別子に変換し、概念識別子間の共起関係に基づいて、概念識別子の特徴ベクトルを自動的に生成する概念ベクトル生成部と、生成した概念識別子の特徴ベクトルを記憶する概念ベクトル記憶部と、概念識別子の特徴ベクトルから文書の特徴ベクトルを生成する文書ベクトル生成部と、文書の特徴ベクトルを記憶する文書ベクトル記憶部と、文書の特徴ベクトル間の類似度を利用して文書を分類する分類部と、分類した結果を記憶する結果記憶部と、を含むことを特徴とする文書分類装置。
IPC (2):
FI (3):
G06F 15/403 350 Z
, G06F 15/38 M
, G06F 15/40 370 A
Patent cited by the Patent:
Cited by examiner (3)
-
文書分類装置
Gazette classification:公開公報
Application number:特願平5-259809
Applicant:シャープ株式会社
-
データベース管理方式
Gazette classification:公開公報
Application number:特願平4-173936
Applicant:日本電気株式会社
-
文書検索システム
Gazette classification:公開公報
Application number:特願平4-133200
Applicant:三洋電機株式会社
Return to Previous Page