特許
J-GLOBAL ID:200903072712162747
構造化文書分類装置およびこの構造化文書分類装置をコンピュータで実現するプログラムを記録した記録媒体、並びに、構造化文書検索システムおよびこの構造化文書検索システムをコンピュータで実現するプログラムを記録した記録媒体
発明者:
出願人/特許権者:
代理人 (1件):
京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-200171
公開番号(公開出願番号):特開2000-029902
出願日: 1998年07月15日
公開日(公表日): 2000年01月28日
要約:
【要約】【課題】 対象のHTML文書が膨大にある検索において、検索精度を高めて、検索者が目的のHTML文書を探す手間を軽減する。【解決手段】 あらかじめHTML文書すべてについて、タグとキーワードによる特徴、イメージ情報による特徴、リンク情報による特徴、タグ構造による特徴から構造的または付帯的な特徴を抽出し、ルールと照合することによって、分類する種別への適合度を計算する。入力されたキーワードと種別を用いてある適合度以下の文書を削除して絞り込んだ結果を表示する。
請求項(抜粋):
構造化文書を種別に分類する構造化文書分類装置において、構造化文書の構造的または付帯的な特徴を抽出し、この抽出した特徴を前記構造的または付帯的な特徴に特化したルールによって照合し、種別への適合度を計算することで該構造化文書を種別に分類することを特徴とする構造化文書分類装置。
FI (2件):
G06F 15/401 310 D
, G06F 15/403 350 C
Fターム (24件):
5B075KK02
, 5B075ND03
, 5B075ND06
, 5B075ND20
, 5B075ND35
, 5B075ND36
, 5B075NK02
, 5B075NK06
, 5B075NK13
, 5B075NK24
, 5B075NK31
, 5B075NR02
, 5B075NR12
, 5B075PP22
, 5B075PP28
, 5B075PQ02
, 5B075PQ46
, 5B075PR06
, 5B075QM08
, 5B075QP01
, 5B075QP10
, 5B075QS01
, 5B075UU05
, 5B075UU40
引用特許:
前のページに戻る