Pat
J-GLOBAL ID:200903000837948032

類似文書検索装置

Inventor:
Applicant, Patent owner:
Agent (1): 鈴木 正剛
Gazette classification:公開公報
Application number (International application number):1996110870
Publication number (International publication number):1997297766
Application date: May. 01, 1996
Publication date: Nov. 18, 1997
Summary:
【要約】【課題】 複数の参照用文書から入力文書に類似する類似文書候補を高い確度で特定し得る類似文書検索装置を提供する。【解決手段】 形態素解析部10により認識された入力文書中のキーワードの個数を計数するキーワードカウント部11、文書に含まれるキーワードを意味分類毎に仕訳するキーワード意味分類決定部12、意味分類に応じた重要度と各意味分類に属するキーワードの個数に依存する評価値を付与する意味分類評価値決定部14、及び評価値に基づいて各参照用文書毎に類似度を付与する文書類似度決定部16とを含んで類似文書検索装置を構成する。
Claim (excerpt):
入力文書の所定領域を形態素解析して該入力文書に記述された語句を自動認識する文字認識手段と、複数の参照用文書から前記認識された語句に関連する少なくとも一つの類似文書候補を特定する類似文書特定手段とを備え、前記類似文書特定手段は、前記文字認識手段で認識された語句群をそれぞれ相異なる値に重み付けられた複数のグループに分類仕訳する第1手段、個々のグループに分類された語句の数に応じて各グループの重み評価値を演算する第2手段、及び前記複数の参照用文書に含まれるグループの各々に前記演算手段より算出された重み評価値を付与して各参照用文書を差別化する第3手段を含んで構成されていることを特徴とする類似文書検索装置。
FI (2):
G06F 15/403 350 C ,  G06F 15/403 340 B

Return to Previous Page