特許
J-GLOBAL ID:200903002707325486

情報検索装置及び情報検索方法

発明者:
出願人/特許権者:
代理人 (1件): 岩橋 文雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-011794
公開番号(公開出願番号):特開2000-207419
出願日: 1999年01月20日
公開日(公表日): 2000年07月28日
要約:
【要約】【課題】 文字連鎖を使って文書番号と出現回数または文字位置を索引ファイルとして格納する場合、文字連鎖毎に文書番号を重複してもっているため同一文書に同一の文字連鎖が多数発生した場合に、索引ファイルが大きくなるという課題、また文字位置で索引場所を指定しているため、文書の内容が変更になった場合、1文字でも追加された文書に変更した場合、全ての文字位置が変更になるため索引の変更が発生し、オンラインで登録する場合に時間がかかるという課題がある。【解決手段】情報検索装置は、索引ファイルが、2文字連鎖の組み数と文書番号と第1、2文字目の出現回数を各文字連鎖毎に組の個数分の2文字連鎖を作成する索引作成手段と、索引ファイルを格納する索引記憶メモリとをもつ。
請求項(抜粋):
登録文字列から2文字連鎖を抽出する第1の文字連鎖抽出手段と、前記2文字連鎖の第1文字・第2文字の出現回数を算出する出現回数手段と、出現回数が算出された2文字連鎖から文書番号毎に重複した2文字連鎖の個数である重複数を算出する文字連鎖組合算出手段と、前記2文字連鎖の出現回数の組を前記文字連鎖組合算出手段から算出された重複数と合わせて文字連鎖情報メモリへ格納する文字連鎖情報格納手段と、検索文字列から2文字連鎖を抽出する第2の文字連鎖抽出手段と、前記文字連鎖情報メモリから取り出された2文字連鎖情報と、前記第2の文字連鎖抽出手段によって抽出された2文字連鎖情報とについて、それぞれの第1文字・第2文字及び文書番号を照合する照合手段と、前記照合手段によって各文書番号について検索文字列のk番目の2文字連鎖の第2文字の出現回数とk+1番目の2文字連鎖の第1文字の出現回数が一致した場合には、k番目の文字連鎖とk+1番目の文字連鎖が連続していると判断され、検索文字列が登録文字列に存在すると判定する判定手段とを備えた情報検索装置。
FI (3件):
G06F 15/401 330 A ,  G06F 15/40 370 A ,  G06F 15/403 340 B
Fターム (9件):
5B075KK34 ,  5B075KK39 ,  5B075ND03 ,  5B075NK02 ,  5B075NK42 ,  5B075NK54 ,  5B075PR04 ,  5B075QR03 ,  5B075UU06

前のページに戻る