Pat
J-GLOBAL ID:200903084860160808
類似文書検索装置、類似文書検索方法及び記録媒体
Inventor:
,
,
,
,
,
Applicant, Patent owner:
Agent (1):
外川 英明
Gazette classification:公開公報
Application number (International application number):2000183953
Publication number (International publication number):2002007468
Application date: Jun. 20, 2000
Publication date: Jan. 11, 2002
Summary:
【要約】【課題】 一定期間に蓄積されるカテゴリ毎の文書量の相違を考慮し、検索対象期間を絞りつつもカテゴリ特定の精度低下を抑え、検索処理速度の向上を図る。【解決手段】 複数の検索対象文書を、カテゴリ毎且つ各々を時系列に所定件数ずつに分割して格納するメモリ1dのバッファ部2bに格納し、検索キー文書の時間情報が示す時間を含む各カテゴリ内の、分割された所定件数ずつの検索対象文書を決め、検索キー文書との類似度に基づいて検索キー文書が属するカテゴリを特定し、そのカテゴリ内の検索対象文書から検索キー文書の類似文書を抽出する。このように検索キー文書の時間情報に対応する各カテゴリの分割範囲にはカテゴリ特定に十分な件数の文書が存在するため、検索対象期間を絞りつつもカテゴリ特定の精度低下を防止し、検索処理速度向上を図ることができる。
Claim (excerpt):
複数の検索対象文書を、カテゴリ毎に、且つ各々を時系列に所定件数ずつに分割して格納する記憶手段と、時間情報を有する検索キー文書を入力する入力手段と、この入力手段にて入力された検索キー文書の時間情報に基づき、この時間情報が示す時間を含む上記各カテゴリ内の、分割された所定件数ずつの検索対象文書を決定する決定手段と、この決定手段にて決定された各検索対象文書と検索キー文書との類似度に基づいて検索キー文書が属するカテゴリを特定する特定手段と、この特定手段にて特定されたカテゴリに含まれる検索対象文書を対象として、検索キー文書に類似する文書を抽出する手段と、を具備することを特徴とする類似文書検索装置。
IPC (2):
G06F 17/30 350
, G06F 17/30 170
FI (2):
G06F 17/30 350 C
, G06F 17/30 170 A
F-Term (9):
5B075ND03
, 5B075NK35
, 5B075NK46
, 5B075PP02
, 5B075PP03
, 5B075PQ02
, 5B075PR06
, 5B075QM08
, 5B075QP03
Return to Previous Page