Pat
J-GLOBAL ID:200903003902716747

ドキュメント分類装置及び方法

Inventor:
Applicant, Patent owner:
Agent (1): 加藤 朝道
Gazette classification:公開公報
Application number (International application number):1996356219
Publication number (International publication number):1998187754
Application date: Dec. 25, 1996
Publication date: Jul. 21, 1998
Summary:
【要約】【課題】単語がある確率で単語クラスタに属するとし、各カテゴリにそのカテゴリにおける単語クラスタの分布と各単語クラスタにおける単語の分布の線形結合モデルを対応させることにより、上記した従来のドキュメント装置の問題点を全て解消し、高精度のドキュメント分類を実現可能とするドキュメント分類装置の提供。【解決手段】単語を単語クラスタに分類する時、該単語がある確率でその単語クラスタに属するとし、さらに、各カテゴリに、そのカテゴリにおける単語クラスタの分布と各単語クラスタにおける単語の分布の線形結合モデルを対応させる。
Claim (excerpt):
カテゴリと該カテゴリに分類されたドキュメントを記憶するカテゴリ記憶部と、カテゴリにおける単語クラスタの分布を記憶する単語クラス分布記憶部と、単語クラスタにおける単語の分布を記憶する単語分布記憶部と、(a)前記カテゴリ記憶部に記憶される、カテゴリと、該カテゴリに分類されたドキュメントと、を参照して、各カテゴリに対応する単語クラスタを作成し、(b)前記各カテゴリについて、該カテゴリにおける単語クラスタの分布と各単語クラスタにおける単語の分布の線形結合モデルを対応させ、前記各単語クラスタにおける単語の分布を推定し、(c)推定された前記各単語クラスタにおける単語の分布を、前記単語分布記憶部に記憶し、(d)さらに各カテゴリにおける単語クラスタの分布を推定し、推定された前記各カテゴリにおける単語クラスタの分布を、前記単語クラスタ記憶部に記憶する学習手段と、新たに入力されるドキュメントをドキュメント分類部に格納するドキュメント入力手段と、(e)前記ドキュメント入力手段から入力されたドキュメントを受け取り、(f)前記単語クラスタ分布記憶部に記憶される各カテゴリにおける単語クラスタの分布を参照し、及び、前記単語分布記憶部に記憶される各単語クラスタにおける単語の分布を参照し、各カテゴリに、該カテゴリにおける単語クラスタの分布と、各単語クラスタにおける単語の分布の線形結合モデルを対応させ、入力されたドキュメントをデータとみなし、該データに対する、各カテゴリの対応する線形結合モデルの負対数尤度を計算し、(g)計算された負対数尤度の最も小さい線形結合モデルの対応するカテゴリに入力されたドキュメントを分類するドキュメント分類手段と、を備えることを特徴とするドキュメント分類装置。
FI (2):
G06F 15/401 310 D ,  G06F 15/40 370 A

Return to Previous Page