特許
J-GLOBAL ID:200903016968233091

文書処理装置及びそのプログラム記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 小笠原 吉義 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-049501
公開番号(公開出願番号):特開2000-250919
出願日: 1999年02月26日
公開日(公表日): 2000年09月14日
要約:
【要約】【課題】本発明は、文書処理装置及びそのプログラム記憶媒体に関し、電子化文書の検索や分類等の処理のためのカテゴリ因子を抽出することを目的とする。【解決手段】 文書処理装置は、主成分単位分解部5は、カテゴリ毎に抽出された特徴語11とこれに基づいて求められた特徴語相関行列12とを用いた当該カテゴリの主成分分析により抽出された主成分係数13と、前記特徴語11とを用いて、特徴語の出現傾向を表す座標系に基づいて主成分の各々に対応する特徴語の群を求め、特徴語の群の多い主成分を選択して主成分因子14とする。また、当該特徴語の群と主成分の各々との相関の強さを用いて、主成分因子14との相関が高い特徴語を選択して因子特徴語15とする。これにより、主成分因子14と因子特徴語15とからなるカテゴリ因子20を抽出する。
請求項(抜粋):
カテゴリ毎に抽出された特徴語とこれに基づいて求められた特徴語相関行列とを用いた当該カテゴリの主成分分析により抽出された主成分係数と、前記特徴語とを用いて、特徴語の出現傾向を表す座標系に基づいて主成分の各々に対応する特徴語の群を求め、当該特徴語の群と主成分の各々との相関の強さを用いて、特徴語の群の多い主成分を選択してなる主成分因子と、主成分因子との相関が高い特徴語を選択してなる因子特徴語とからなるカテゴリ因子を、当該カテゴリから抽出する主成分単位分解部を備えることを特徴とする文書処理装置。
FI (2件):
G06F 15/401 310 A ,  G06F 15/40 370 A
Fターム (6件):
5B075ND03 ,  5B075NK02 ,  5B075NK31 ,  5B075PR04 ,  5B075QM08 ,  5B075UU06

前のページに戻る