特許
J-GLOBAL ID:202103012992564686
文書検索装置
発明者:
出願人/特許権者:
代理人 (1件):
森下 賢樹
公報種別:特許公報
出願番号(国際出願番号):特願2016-217884
公開番号(公開出願番号):特開2018-077611
特許番号:特許第6787755号
出願日: 2016年11月08日
公開日(公表日): 2018年05月17日
請求項(抜粋):
【請求項1】 複数の文書データを記憶する第1文書記憶部であって、前記複数の文書データのそれぞれは、オリジナル文書に記載された互いに異なる複数の単語が、互いに異なる固定長のコードに変換されたものである第1文書記憶部と、
前記第1文書記憶部に記憶された複数の文書データに対応する変換前の文書データである複数のオリジナル文書データを記憶する第2文書記憶部と、
複数の単語を指定する検索要求であって、かつ、それら複数の単語が存在すべき範囲を単語数で指定する検索要求を受け付ける受付部と、
検索要求で指定された複数の単語のそれぞれに対応する固定長のコードを取得する取得部と、
検索要求で指定された単語数基準の範囲と、固定のコード長とに応じて、文字数基準の範囲を導出する導出部と、
前記取得部により取得された複数の単語のコードと、前記導出部により導出された文字数基準の範囲とを条件とする近傍検索を実行し、前記第1文書記憶部に記憶された複数の文書データの中から前記条件を満たす文書データを抽出し、前記第1文書記憶部から抽出した文書データに対応するオリジナル文書データを前記第2文書記憶部から抽出する検索部と、
を備え、
前記第1文書記憶部に記憶される文書データは、オリジナル文書データに記載された単語に予め対応付けられたコードが記録されたものであり、オリジナル文書データに記載された或る単語に対応するコードが未定義の場合、その単語に関するコードは前記文書データに記録されず、
検索要求で指定された複数の単語のうち一部の単語に対応するコードが未定義の場合、前記検索部は、対応するコードが存在する単語のコードに基づく近傍検索を実行し、当該近傍検索で抽出した1つ以上のオリジナル文書データの中から、前記一部の単語を含むオリジナル文書データを抽出することを特徴とする文書検索装置。
IPC (1件):
FI (1件):
引用特許:
前のページに戻る