Pat
J-GLOBAL ID:200903038162794194
文書分類用の学習装置、及びこれを用いた文書分類方法並びに文書分類装置
Inventor:
,
Applicant, Patent owner:
Agent (2):
蔵合 正博
, 酒井 一
Gazette classification:公開公報
Application number (International application number):2003120753
Publication number (International publication number):2004326465
Application date: Apr. 24, 2003
Publication date: Nov. 18, 2004
Summary:
【課題】高次元の文書ベクトルを適切に圧縮、離散化し、ベイジアンネットワークによる分類学習および文書分類を可能にする。【解決手段】文書の特長をあらわす高次元ベクトルを、主成分分析などの行列演算により低次元近似し、MDL基準などのモデル選択基準にもとづく離散化と素性選択を行い、ベイジアンネットワークの入力とする。
Claim (excerpt):
各文書に対して、決められたカテゴリに属すかどうかがラベル付けされている学習用文書集合を用いて、教師あり学習を行ったベイジアンネットワークを用いて、新規に与えられる各文書が各カテゴリに属す確率を計算する文書分類方法において、前記ベイジアンネットワークへの入力として、各文書の持つ特徴を表す高次元ベクトルを、学習データに基づく行列演算による次元圧縮により低次元近似して得られる実数ベクトルに対して、モデル選択基準を用いた学習に基づく区間分割を行って得られる離散値からなる素性ベクトルを用いることを特徴とする文書分類方法。
IPC (1):
FI (2):
G06F17/30 210D
, G06F17/30 170Z
F-Term (5):
5B075ND03
, 5B075ND20
, 5B075NR02
, 5B075NR12
, 5B075UU06
Return to Previous Page