特許
J-GLOBAL ID:200903047098471130
文書分類装置及び文書検索装置
発明者:
出願人/特許権者:
代理人 (1件):
川口 義雄 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-151640
公開番号(公開出願番号):特開平9-006799
出願日: 1995年06月19日
公開日(公表日): 1997年01月10日
要約:
【要約】【目的】 言語の種類を問わず、文書を分類したり検索したりすることができる装置を提供する。【構成】 文書分類装置において、文書データを記憶する文書記憶部101と、文書データを解析する文書解析部102と、文書中の概念識別子の特徴ベクトルを生成する概念ベクトル生成部103と、その特徴ベクトルを記憶する概念ベクトル記憶部104と、文書内に含まれている概念識別子の特徴ベクトルから文書の特徴ベクトルを生成する文書ベクトル生成部105と、その特徴ベクトルを記憶する文書ベクトル記憶部106と、文書特徴ベクトル間の類似度を利用して文書を分類する分類部107と、その分類した結果を記憶する結果記憶部108と、特徴ベクトル生成時に使用する単語や概念識別子が登録されている特徴ベクトル生成用辞書109とを備える。
請求項(抜粋):
文書の内容にしたがって文書の分類を行う文書分類装置であって、文書データを記憶する文書記憶部と、予め定められた単語及び概念識別子を登録した特徴ベクトル生成用辞書と、前記特徴ベクトル生成用辞書によって、記憶した文書データの単語を解析する文書解析部と、前記特徴ベクトル生成用辞書によって、文書データの単語を概念識別子に変換し、概念識別子間の共起関係に基づいて、概念識別子の特徴ベクトルを自動的に生成する概念ベクトル生成部と、生成した概念識別子の特徴ベクトルを記憶する概念ベクトル記憶部と、概念識別子の特徴ベクトルから文書の特徴ベクトルを生成する文書ベクトル生成部と、文書の特徴ベクトルを記憶する文書ベクトル記憶部と、文書の特徴ベクトル間の類似度を利用して文書を分類する分類部と、分類した結果を記憶する結果記憶部と、を含むことを特徴とする文書分類装置。
IPC (2件):
FI (3件):
G06F 15/403 350 Z
, G06F 15/38 M
, G06F 15/40 370 A
引用特許:
審査官引用 (3件)
-
文書分類装置
公報種別:公開公報
出願番号:特願平5-259809
出願人:シャープ株式会社
-
データベース管理方式
公報種別:公開公報
出願番号:特願平4-173936
出願人:日本電気株式会社
-
文書検索システム
公報種別:公開公報
出願番号:特願平4-133200
出願人:三洋電機株式会社
前のページに戻る