特許
J-GLOBAL ID:201703014037669678

検索装置、検索方法及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 木村 満
公報種別:公開公報
出願番号(国際出願番号):特願2016-052786
公開番号(公開出願番号):特開2017-167837
出願日: 2016年03月16日
公開日(公表日): 2017年09月21日
要約:
【課題】Nグラムを用いた電子文書の検索において、検索時間を短縮する。【解決手段】検索装置100において、データ記憶部110は、第1のインデックスと第2のインデックスとを記憶する。取得部130は、検索キーワードを取得する。インクリメンタル検索部141は、検索キーワードに含まれる複数のNグラムの出現位置を第1のインデックスから読み出し、読み出した出現位置の連続性を評価することによって、第1のカテゴリに属するテキストから検索キーワードを検索する。全文検索部142は、検索キーワードに含まれる複数のNグラムの出現位置を第1のインデックス及び第2のインデックスから読み出し、読み出した出現位置の連続性を評価することによって、電子文書から検索キーワードを検索する。出力部160は、検索結果を出力する。【選択図】図3
請求項(抜粋):
検索対象の電子文書のうちの第1のカテゴリに属するテキストに含まれる複数のNグラムと、前記第1のカテゴリに属するテキストにおける当該複数のNグラムの出現位置と、を対応付けた第1のインデックス、及び、前記電子文書のうちの第2のカテゴリに属するテキストに含まれる複数のNグラムと、前記第2のカテゴリに属するテキストにおける当該複数のNグラムの出現位置と、を対応付けた第2のインデックスを記憶する記憶手段と、 検索キーワードを取得する取得手段と、 前記検索キーワードに含まれる複数のNグラムの出現位置を前記第1のインデックスから読み出し、読み出した出現位置の連続性を評価することによって、前記第1のカテゴリに属するテキストから前記検索キーワードを検索する第1の検索手段と、 前記検索キーワードに含まれる複数のNグラムの出現位置を前記第1のインデックス及び前記第2のインデックスから読み出し、読み出した出現位置の連続性を評価することによって、前記電子文書から前記検索キーワードを検索する第2の検索手段と、 少なくとも前記第1の検索手段と前記第2の検索手段の一方による検索結果を出力する出力手段と、 を備えることを特徴とする検索装置。
IPC (1件):
G06F 17/30
FI (2件):
G06F17/30 414B ,  G06F17/30 170A
引用特許:
出願人引用 (4件)
全件表示
審査官引用 (4件)
全件表示

前のページに戻る