Pat
J-GLOBAL ID:200903072712162747

構造化文書分類装置およびこの構造化文書分類装置をコンピュータで実現するプログラムを記録した記録媒体、並びに、構造化文書検索システムおよびこの構造化文書検索システムをコンピュータで実現するプログラムを記録した記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 京本 直樹 (外2名)
Gazette classification:公開公報
Application number (International application number):1998200171
Publication number (International publication number):2000029902
Application date: Jul. 15, 1998
Publication date: Jan. 28, 2000
Summary:
【要約】【課題】 対象のHTML文書が膨大にある検索において、検索精度を高めて、検索者が目的のHTML文書を探す手間を軽減する。【解決手段】 あらかじめHTML文書すべてについて、タグとキーワードによる特徴、イメージ情報による特徴、リンク情報による特徴、タグ構造による特徴から構造的または付帯的な特徴を抽出し、ルールと照合することによって、分類する種別への適合度を計算する。入力されたキーワードと種別を用いてある適合度以下の文書を削除して絞り込んだ結果を表示する。
Claim (excerpt):
構造化文書を種別に分類する構造化文書分類装置において、構造化文書の構造的または付帯的な特徴を抽出し、この抽出した特徴を前記構造的または付帯的な特徴に特化したルールによって照合し、種別への適合度を計算することで該構造化文書を種別に分類することを特徴とする構造化文書分類装置。
FI (2):
G06F 15/401 310 D ,  G06F 15/403 350 C
F-Term (24):
5B075KK02 ,  5B075ND03 ,  5B075ND06 ,  5B075ND20 ,  5B075ND35 ,  5B075ND36 ,  5B075NK02 ,  5B075NK06 ,  5B075NK13 ,  5B075NK24 ,  5B075NK31 ,  5B075NR02 ,  5B075NR12 ,  5B075PP22 ,  5B075PP28 ,  5B075PQ02 ,  5B075PQ46 ,  5B075PR06 ,  5B075QM08 ,  5B075QP01 ,  5B075QP10 ,  5B075QS01 ,  5B075UU05 ,  5B075UU40
Patent cited by the Patent:
Cited by examiner (2)

Return to Previous Page