特許
J-GLOBAL ID:200903056694076956

文書分類装置および文書分類方法

発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願平11-282014
公開番号(公開出願番号):特開2001-101227
出願日: 1999年10月01日
公開日(公表日): 2001年04月13日
要約:
【要約】【課題】 分類基準が異なる部分文書集合を多数抽出できるようにして、文書集合に対する包括的な分析を行うことができる文書分類装置などを提供する。【解決手段】 文書の内容に従って文書集合を分類する文書分類装置において、文書集合中のそれぞれの文書データの単語を解析する文書解析部2、その解析結果に基づいて文書特徴ベクトルを求める特徴ベクトル生成部3、所定の基準に基づき文書特徴ベクトルの特徴次元を操作して文書特徴ベクトルを修正する特徴ベクトル修正部4、修正された文書特徴ベクトルを含む文書特徴ベクトル間の類似度に基づいて文書集合を複数の部分文書集合に分類する文書分類部5とを備え、文書分類部5が分類結果を分類結果記憶部6に記憶させた後、所定のくり返し条件に従って、特徴ベクトル修正部4が文書特徴ベクトルを修正する動作、文書分類部5が部分文書集合に分類する動作をくり返す構成にした。
請求項(抜粋):
文書の内容に従って文書集合を自動的に分類する文書分類装置において、複数の文書から成る文書集合のそれぞれの文書データ中の単語を解析する文書解析手段と、前記文書解析手段による解析結果に基づいて文書特徴ベクトルを求める特徴ベクトル生成手段と、所定の基準に基づき前記文書特徴ベクトルの特徴次元を操作して前記文書特徴ベクトルを修正する特徴ベクトル修正手段と、修正された文書特徴ベクトルを含む文書特徴ベクトル間の類似度に基づいて文書集合を複数の部分文書集合に分類し分類結果を分類結果記憶手段に記憶させる文書分類手段とを備え、前記文書分類手段が分類結果を記憶させた後、所定のくり返し条件を用いた判定に従い、くり返しと判定された場合、前記特徴ベクトル修正手段が文書特徴ベクトルを修正する動作、および文書分類手段が部分文書集合に分類し結果を記憶する動作をくり返す構成にしたことを特徴とする文書分類装置。
FI (2件):
G06F 15/401 310 D ,  G06F 15/40 370 A
Fターム (4件):
5B075ND03 ,  5B075NR02 ,  5B075NR12 ,  5B075NS10
引用特許:
審査官引用 (4件)
全件表示
引用文献:
前のページに戻る