特許
J-GLOBAL ID:200903095047542967

全文登録語検索装置および方法

発明者:
出願人/特許権者:
代理人 (1件): 南野 貞男 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-083534
公開番号(公開出願番号):特開平8-255155
出願日: 1995年03月16日
公開日(公表日): 1996年10月01日
要約:
【要約】【目的】 本文中の単語を登録しタグにより区切った参照単位毎にアクセス可能に検索インデックスを作成すると共に、参照単位毎に本文を圧縮し、本文の記憶容量を少なくして、全文の登録語の検索を能率よく行う。【構成】 タグを有する文書の本文を収めた本文ファイルを入力し、タグで区切られた参照単位に分割する参照単位分割部と、参照単位の本文を圧縮し、圧縮された本文の圧縮ブロックの位置と参照単位の位置を関係づける本文圧縮処理部と、参照単位に含まれる検索対象とする単語に対して、単語と当該単語が出現する本文における参照単位の位置の対を抽出する単語位置抽出部と、抽出された単語と参照単位の位置に対応する圧縮ブロックの位置との対を単語に従って分類し、単語に対し当該単語が出現する全ての圧縮ブロックの位置を組とした単語位置集合を得る分類部と、単語位置集合に対し、単語から圧縮ブロックの位置集合を得る検索インデックスを生成する検索インデックス生成部と、生成した検索インデックスと圧縮された本文の圧縮ブロックとを接続する検索インデックス圧縮本文接続部とを備える。
請求項(抜粋):
タグを有する文書の本文を収めた本文ファイルを入力し、タグで区切られた参照単位に分割する参照単位分割部と、参照単位の本文を圧縮し、圧縮された本文の圧縮ブロックの位置と参照単位の位置を関係づける本文圧縮処理部と、参照単位に含まれる検索対象とする単語に対して、単語と当該単語が出現する本文における参照単位の位置の対を抽出する単語位置抽出部と、抽出された単語と参照単位の位置に対応する圧縮ブロックの位置との対を単語に従って分類し、単語に対し当該単語が出現する全ての圧縮ブロックの位置を組とした単語位置集合を得る分類部と、単語位置集合に対し、単語から圧縮ブロックの位置集合を得る検索インデックスを生成する検索インデックス生成部と、生成した検索インデックスと圧縮された本文の圧縮ブロックとを接続する検索インデックス圧縮本文接続部とを備えることを特徴とする全文登録語検索装置。
IPC (3件):
G06F 17/21 ,  G06F 17/27 ,  G06F 17/30
FI (4件):
G06F 15/20 590 E ,  G06F 15/20 550 E ,  G06F 15/40 370 H ,  G06F 15/401 310 C
引用特許:
審査官引用 (3件)

前のページに戻る