Pat
J-GLOBAL ID:200903018693269239
文書自動分類システム、文書分類向け知識ベース生成方法及びそのプログラムを記録した記録媒体
Inventor:
Applicant, Patent owner:
Agent (1):
鈴木 誠
Gazette classification:公開公報
Application number (International application number):1997198113
Publication number (International publication number):1999039313
Application date: Jul. 24, 1997
Publication date: Feb. 12, 1999
Summary:
【要約】【課題】 意味カテゴリーの多義性を解消し、高精度の文書自動分類システムを提供する。【解決手段】 分類タグ付き文書集合を入力し、シソーラス辞書を用いて、該文書を特徴付ける単語とその意味カテゴリーと該文書の分類カテゴリーからなる学習データを生成する手段、該学習データについて、分類カテゴリーと特徴間の関連度を計算する手段、該関連度に基づいて、前記学習データから不適切な特徴を除去して新たな学習データを生成する手段、該新たな学習データについて、分類カテゴリーと特徴間の重みを計算して文書分類向け知識ベースを生成する手段を設ける。
Claim (excerpt):
シソーラス辞書を用いた文書自動分類システムにおいて、分類タグ付き文書集合とシソーラス辞書を入力とし、文書を特徴付ける単語とその意味カテゴリーと当該文書の分類カテゴリーから構成される学習データを生成する手段と、前記生成された学習データを入力とし、分類カテゴリーと特徴間の関連度を計算する手段と、前記計算された関連度と前記学習データを入力とし、学習データから不適切な特徴を除去して新たな学習データを生成する手段と、前記生成された新たな学習データを入力とし、分類カテゴリーと特徴間の重みを計算して文書分類向け知識ベースを生成する手段と、未分類の文書を入力とし、前記知識ベースを元に対応する分類カテゴリーを出力する手段とを有することを特徴とする文書自動分類システム。
Return to Previous Page