特許
J-GLOBAL ID:200903013900146124

確率モデルによる文書分類方法

発明者:
出願人/特許権者:
代理人 (1件): 小川 勝男
公報種別:公開公報
出願番号(国際出願番号):特願平7-215670
公開番号(公開出願番号):特開平9-062693
出願日: 1995年08月24日
公開日(公表日): 1997年03月07日
要約:
【要約】【目的】 分類済みの文書集合(訓練用データ)をもとに新たな文書を分類する際、訓練用データが不十分な場合でもデータ補完を行うことなしに文書分類が可能になる文書の確率的特徴付けの方法とそれに基づく文書分類の方法の提供。【構成】 特徴付けの対象となる文書集合Cは、それが含む単語の集合Wで表現される。ここで、単語集合Wから単語を無作為抽出する事象を考え、無作為抽出した単語がある特定の単語wiと等しいという事象をT=wiとおき、確率P(T=wi|C)を推定する。事象T=wiは全てのwiに関して背反であるため、Wに含まれる全ての単語wiに対して確率P(T=wi|C)を推定し、それらを総和した確率は、文書集合Cを単語集合Wで特徴付けたことになる。
請求項(抜粋):
訓練用データとしての分類済みの文書をもとに新たな文書を確率的に分類する際、文書を単語の集合として表現しておき、その集合から単語をランダムに抽出する確率事象により文書を特徴付ける方法。
FI (2件):
G06F 15/401 310 A ,  G06F 15/401 310 D

前のページに戻る