特許
J-GLOBAL ID:200903027484250813

階層型文章分類装置およびプログラムを記録した機械読み取り可能な記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 境 廣巳
公報種別:公開公報
出願番号(国際出願番号):特願平10-064682
公開番号(公開出願番号):特開平11-250100
出願日: 1998年02月27日
公開日(公表日): 1999年09月17日
要約:
【要約】【課題】 文章(テキスト、ドキュメント)に現れる単語(キーワード)の分布を基に文章をカテゴリの階層に分類する。【解決手段】 文章分類を統計的検定問題として捉える。カテゴリ階層記憶部1ではカテゴリの階層が記憶される。確率モデル記憶部2では、線形結合モデルが記憶される。学習部3は、カテゴリ階層記憶部1に記憶されるカテゴリの階層を参照し、既にカテゴリに分類された文章から各カテゴリの対応する線形結合モデルを学習し、線形結合モデルを確率モデル記憶部2に記憶する。文章分類部4は、新しく文章を入力し、カテゴリ階層記憶部1に記憶されるカテゴリの階層における各カテゴリを参照し、各カテゴリに対して、確率モデル記憶部2から、そのカテゴリに対応する線形結合モデルを参照し、入力文章に対する各線形結合モデルの負対数尤度を計算し、負対数尤度の最も小さい線形結合モデルに対応するカテゴリに入力文章を分類する。
請求項(抜粋):
ノードが文章の分類されたカテゴリを表現し、リンクがカテゴリの上位下位関係を表現するグラフとして、カテゴリの階層を記憶するカテゴリ階層記憶部、前記カテゴリ階層記憶部に記憶されるカテゴリの階層の各カテゴリに対して、より下位のカテゴリの単語空間上の確率モデルの重みつき平均を該カテゴリの線形結合モデルとし、各カテゴリの線形結合モデルを記憶する確率モデル記憶部、前記カテゴリ階層記憶部に記憶されるカテゴリの階層の各カテゴリに分類された文章を基に、各カテゴリの線形結合モデルを、より下位のカテゴリの線形結合モデルから学習し、学習できた各カテゴリの線形結合モデルを前記確率モデル記憶部に記憶する学習部、新しく文章を入力し、該入力文章を単語のデータ列と見なし、前記カテゴリ階層記憶部に記憶されるカテゴリの階層の各カテゴリに対して、前記確率モデル記憶部に記憶される該カテゴリの線形結合モデルの該入力文章に対する負対数尤度を計算し、計算された負対数尤度の最も小さいカテゴリに該入力文章を分類する文章分類部、を備えることを特徴とする階層型文章分類装置。
IPC (3件):
G06F 17/30 ,  G06F 15/18 560 ,  G06F 17/21
FI (5件):
G06F 15/401 310 D ,  G06F 15/18 560 A ,  G06F 15/20 570 Z ,  G06F 15/20 590 Z ,  G06F 15/40 370 A

前のページに戻る