特許
J-GLOBAL ID:200903029433608058

文書検索装置

発明者:
出願人/特許権者:
代理人 (1件): 守山 辰雄
公報種別:公開公報
出願番号(国際出願番号):特願平11-001921
公開番号(公開出願番号):特開2000-200287
出願日: 1999年01月07日
公開日(公表日): 2000年07月18日
要約:
【要約】【課題】 欧米語に限らずたとえば日本語のように単語の区切りが明確でない文書に対しても、比較的小さな容量のインデックスを用いて文書の全文検索を実行することができる文書検索装置を提供する。【解決手段】 インデックス1に文書に含まれている全ての単語について重複を省き、これら単語とともに文書中で当該単語に隣接している単語に関する情報を付加して格納しておき、検索時には、複数の単語とこれら単語の並びとを含む検索条件に基づいて、検索手段4、5が、インデックス1に格納された複数の単語と検索条件との合致を判定して、文書が検索条件に合致するか否かを判定する。また、インデックス1から単語列を復元して、該当する文書を復元出力する。
請求項(抜粋):
文書が検索条件に合致するか否かを判定する文書検索装置において、文書に含まれている全ての単語について重複を省き、これら単語に前記文書中で当該単語に隣接している単語に関する情報を付加して格納する単語格納手段と、複数の単語とこれら単語の並びとを含む検索条件に基づいて、前記単語格納手段に格納された複数の単語と当該検索条件との合致を判定する文書検索手段と、を備え、前記単語格納手段は、前記全ての単語を当該単語格納手段におけるアドレスによって同定して格納するとともに、当該単語の直後に前記隣接している単語を格納し、当該単語に前記単語に関する情報として前記隣接している単語に更に隣接している単語が格納されるアドレスを所定の順序で付加して格納して、アドレスの繋がりにより文書中における単語の並びを表していることを特徴とする文書検索装置。
IPC (2件):
G06F 17/30 ,  G06F 12/00 520
FI (4件):
G06F 15/40 370 A ,  G06F 12/00 520 A ,  G06F 15/401 310 A ,  G06F 15/403 330 C
Fターム (7件):
5B075ND03 ,  5B075ND35 ,  5B075NR03 ,  5B075PP22 ,  5B075PP30 ,  5B082BA03 ,  5B082EA05

前のページに戻る