特許
J-GLOBAL ID:200903050657247335

汎用データ検索方法

発明者:
出願人/特許権者:
代理人 (1件): 杉本 丈夫 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2002-080844
公開番号(公開出願番号):特開2003-281190
出願日: 2002年03月22日
公開日(公表日): 2003年10月03日
要約:
【要約】【課題】 テキスト・画像・音声等の多様なデータを統一的に構成し、所望の被検索データにより近接データを抽出できる汎用データ検索方法を実現する。【解決手段】 本発明に係る汎用データ検索方法は、ビットパターン又はバイトパターンで表現された多数のファイルデータからファイルデータ集合を形成し、各ファイルデータから所定長さのベクトルを複数切り出して切り出しベクトル集合を形成し、他方、被検索データを同一の手順で加工して同一長の被検索切り出しベクトル集合を形成するから、テキスト・画像・音声等の多様なデータを統一的に検索できる。また、切り出しベクトルの数理変換によりデータに巡回・置換・交換等のパターン変形があっても関連性の深いデータを類似データとして判定でき、また次元数の圧縮も可能となる。更に、量子化により僅かな数値上の違いを超えた検索を可能にし同時にベクトル数を大幅に圧縮し、また逆引情報ファイルの作成により検索速度の高速化を実現できる。
請求項(抜粋):
ビットパターン又はバイトパターンで表現された多数のファイルデータからファイルデータ集合を形成し、各ファイルデータから所定長さのベクトルを複数切り出して切り出しベクトル集合を形成し、各切り出しベクトルを数理変換して得られた変換ベクトルから変換ベクトル集合を形成し、各変換ベクトルの成分を所望段階に量子化して得られた特徴ベクトルから特徴ベクトル集合を形成し、この特徴ベクトル集合において同一の特徴ベクトルが複数存在するときは一つのみを残し他を除去してベクトル数を低減させた非重複特徴ベクトル集合を形成し、各非重複特徴ベクトルがどのファイルデータに帰属するかを対応させて一覧化した逆引情報ファイルを形成することを特徴とする汎用データ検索方法における検索用データベース構築方法。
IPC (4件):
G06F 17/30 414 ,  G06F 17/30 350 ,  G06T 1/00 200 ,  G06T 7/00 300
FI (4件):
G06F 17/30 414 B ,  G06F 17/30 350 C ,  G06T 1/00 200 E ,  G06T 7/00 300 F
Fターム (10件):
5B050EA04 ,  5B050EA18 ,  5B050GA08 ,  5B075NK49 ,  5B075QM05 ,  5L096EA35 ,  5L096FA22 ,  5L096FA35 ,  5L096JA11 ,  5L096KA09

前のページに戻る