特許
J-GLOBAL ID:200903055347363973

類似文書検索装置及び類似文書検索方法

発明者:
出願人/特許権者:
代理人 (1件): 三澤 正義
公報種別:公開公報
出願番号(国際出願番号):特願平9-097630
公開番号(公開出願番号):特開平10-289246
出願日: 1997年04月15日
公開日(公表日): 1998年10月27日
要約:
【要約】【課題】 本発明は、文書数が多い場合であっても、効率良く検索キー文書に類似している文書を検索することが可能な類似文書検索装置を提供する。【解決手段】 入力装置2から検索キー文書を入し、外部記憶装置4中の各文書及び前記検索キー文書からその内容を示唆する文書注目文脈情報を抽出し、外部記憶装置4中の内容別の文書群を一纏まりとしてカテゴリ注目文脈情報を抽出し、文書注目文脈情報と、内容別の一纏まりの文書群から抽出したカテゴリ注目文脈情報とのカテゴリ類似度を算出し、算出したカテゴリ類似度に応じて前記文書データベース中から検索キー文書との間で文書類似度を算出する文書群を選抜し、この文書類似度算出手段により算出した各文書類似度を基に検索した文書の識別情報を検索結果として表示装置3へ出力するようにしたものである。
請求項(抜粋):
一文書を検索キーとして、文書群が内容別に格納されている文書データベース中から類似文書を抽出する類似文書検索装置において、検索キー文書を入力する入力手段と、文書データベース中の各文書及び前記検索キー文書からその内容を示唆する文書注目文脈情報を抽出する文書注目文脈情報抽出手段と、文書データベース中の内容別の文書群を一纏まりとしてカテゴリ注目文脈情報を抽出するカテゴリ注目文脈情報情報抽出手段と、検索キー文書から抽出した文書注目文脈情報と、内容別の一纏まりの文書群から抽出したカテゴリ注目文脈情報とのカテゴリ類似度を算出するカテゴリ類似度算出手段と、このカテゴリ類似度算出手段により算出したカテゴリ類似度に応じて前記文書データベース中から検索キー文書との間で文書類似度を算出する文書群を選抜する類似度算出文書選抜手段と、この類似度算出文書選抜手段より選抜した文書群の文書注目文脈情報と検索キー文書の文書注目文脈情報とを基に選抜した文書群の各文書類似度を算出する文書類似度算出手段と、この文書類似度算出手段により算出した各文書類似度を基に検索した文書の識別情報を検索結果として出力する出力手段と、を有することを特徴とする類似文書検索装置。
FI (2件):
G06F 15/403 350 C ,  G06F 15/40 370 A

前のページに戻る