特許
J-GLOBAL ID:200903018693269239

文書自動分類システム、文書分類向け知識ベース生成方法及びそのプログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 誠
公報種別:公開公報
出願番号(国際出願番号):特願平9-198113
公開番号(公開出願番号):特開平11-039313
出願日: 1997年07月24日
公開日(公表日): 1999年02月12日
要約:
【要約】【課題】 意味カテゴリーの多義性を解消し、高精度の文書自動分類システムを提供する。【解決手段】 分類タグ付き文書集合を入力し、シソーラス辞書を用いて、該文書を特徴付ける単語とその意味カテゴリーと該文書の分類カテゴリーからなる学習データを生成する手段、該学習データについて、分類カテゴリーと特徴間の関連度を計算する手段、該関連度に基づいて、前記学習データから不適切な特徴を除去して新たな学習データを生成する手段、該新たな学習データについて、分類カテゴリーと特徴間の重みを計算して文書分類向け知識ベースを生成する手段を設ける。
請求項(抜粋):
シソーラス辞書を用いた文書自動分類システムにおいて、分類タグ付き文書集合とシソーラス辞書を入力とし、文書を特徴付ける単語とその意味カテゴリーと当該文書の分類カテゴリーから構成される学習データを生成する手段と、前記生成された学習データを入力とし、分類カテゴリーと特徴間の関連度を計算する手段と、前記計算された関連度と前記学習データを入力とし、学習データから不適切な特徴を除去して新たな学習データを生成する手段と、前記生成された新たな学習データを入力とし、分類カテゴリーと特徴間の重みを計算して文書分類向け知識ベースを生成する手段と、未分類の文書を入力とし、前記知識ベースを元に対応する分類カテゴリーを出力する手段とを有することを特徴とする文書自動分類システム。

前のページに戻る