Pat
J-GLOBAL ID:200903016968233091
文書処理装置及びそのプログラム記憶媒体
Inventor:
Applicant, Patent owner:
Agent (1):
小笠原 吉義 (外2名)
Gazette classification:公開公報
Application number (International application number):1999049501
Publication number (International publication number):2000250919
Application date: Feb. 26, 1999
Publication date: Sep. 14, 2000
Summary:
【要約】【課題】本発明は、文書処理装置及びそのプログラム記憶媒体に関し、電子化文書の検索や分類等の処理のためのカテゴリ因子を抽出することを目的とする。【解決手段】 文書処理装置は、主成分単位分解部5は、カテゴリ毎に抽出された特徴語11とこれに基づいて求められた特徴語相関行列12とを用いた当該カテゴリの主成分分析により抽出された主成分係数13と、前記特徴語11とを用いて、特徴語の出現傾向を表す座標系に基づいて主成分の各々に対応する特徴語の群を求め、特徴語の群の多い主成分を選択して主成分因子14とする。また、当該特徴語の群と主成分の各々との相関の強さを用いて、主成分因子14との相関が高い特徴語を選択して因子特徴語15とする。これにより、主成分因子14と因子特徴語15とからなるカテゴリ因子20を抽出する。
Claim (excerpt):
カテゴリ毎に抽出された特徴語とこれに基づいて求められた特徴語相関行列とを用いた当該カテゴリの主成分分析により抽出された主成分係数と、前記特徴語とを用いて、特徴語の出現傾向を表す座標系に基づいて主成分の各々に対応する特徴語の群を求め、当該特徴語の群と主成分の各々との相関の強さを用いて、特徴語の群の多い主成分を選択してなる主成分因子と、主成分因子との相関が高い特徴語を選択してなる因子特徴語とからなるカテゴリ因子を、当該カテゴリから抽出する主成分単位分解部を備えることを特徴とする文書処理装置。
FI (2):
G06F 15/401 310 A
, G06F 15/40 370 A
F-Term (6):
5B075ND03
, 5B075NK02
, 5B075NK31
, 5B075PR04
, 5B075QM08
, 5B075UU06
Return to Previous Page