特許
J-GLOBAL ID:200903074649338840

パターン検索方法、パターン検索装置、コンピュータプログラム及び記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 坂口 博 (外4名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-004189
公開番号(公開出願番号):特開2002-229987
出願日: 2001年01月11日
公開日(公表日): 2002年08月16日
要約:
【要約】【課題】 大規模テキストデータベースの検索において、処理を行うためのデータ構造におけるデータサイズの増大を抑えながら、高速な検索を実現する。【解決手段】 検索対象である文字列中から所望のパターンを検索するパターン検索方法において、次の範囲検索ステップと、文字列抽出ステップとを含む。すなわち、範囲検索ステップにおいて、このパターンの最後の文字から前方へ1文字ずつ順に加えて得られる各中間パターンに関して、この中間パターンの先頭の文字が検索対象の文字列に対する接尾辞配列のどの範囲に存在するかを順次検索する。次に、文字列抽出ステップにおいて、当該接尾辞配列の範囲に含まれる各要素に対応する文字列の要素を特定し、この文字列の各要素を先頭としてこのパターンの要素数と同じ数の要素からなる部分文字列を抽出する文字列抽出ステップとを含むことを特徴とする。
請求項(抜粋):
検索対象である文字列中から所望のパターンを検索するパターン検索方法において、前記パターンの最後の文字から前方へ1文字ずつ順に加えて得られる各中間パターンに関して、当該中間パターンの先頭の文字が前記文字列に対する接尾辞配列のどの範囲に存在するかを順次検索する範囲検索ステップと、前記検索により前記パターン自体に関して得られた前記接尾辞配列の前記範囲に含まれる各要素に対応する前記文字列の要素を特定し、当該文字列の各要素を先頭として前記パターンの要素数と同じ数の要素からなる部分文字列を抽出する文字列抽出ステップとを含むことを特徴とするパターン検索方法。
IPC (2件):
G06F 17/30 170 ,  G06F 17/30 350
FI (2件):
G06F 17/30 170 A ,  G06F 17/30 350 C
Fターム (3件):
5B075ND03 ,  5B075QM06 ,  5B075QS01

前のページに戻る