特許
J-GLOBAL ID:200903038162794194

文書分類用の学習装置、及びこれを用いた文書分類方法並びに文書分類装置

発明者:
出願人/特許権者:
代理人 (2件): 蔵合 正博 ,  酒井 一
公報種別:公開公報
出願番号(国際出願番号):特願2003-120753
公開番号(公開出願番号):特開2004-326465
出願日: 2003年04月24日
公開日(公表日): 2004年11月18日
要約:
【課題】高次元の文書ベクトルを適切に圧縮、離散化し、ベイジアンネットワークによる分類学習および文書分類を可能にする。【解決手段】文書の特長をあらわす高次元ベクトルを、主成分分析などの行列演算により低次元近似し、MDL基準などのモデル選択基準にもとづく離散化と素性選択を行い、ベイジアンネットワークの入力とする。
請求項(抜粋):
各文書に対して、決められたカテゴリに属すかどうかがラベル付けされている学習用文書集合を用いて、教師あり学習を行ったベイジアンネットワークを用いて、新規に与えられる各文書が各カテゴリに属す確率を計算する文書分類方法において、前記ベイジアンネットワークへの入力として、各文書の持つ特徴を表す高次元ベクトルを、学習データに基づく行列演算による次元圧縮により低次元近似して得られる実数ベクトルに対して、モデル選択基準を用いた学習に基づく区間分割を行って得られる離散値からなる素性ベクトルを用いることを特徴とする文書分類方法。
IPC (1件):
G06F17/30
FI (2件):
G06F17/30 210D ,  G06F17/30 170Z
Fターム (5件):
5B075ND03 ,  5B075ND20 ,  5B075NR02 ,  5B075NR12 ,  5B075UU06

前のページに戻る