特許
J-GLOBAL ID:201103054249211954
情報処理プログラム、情報検索プログラム、情報処理装置、および情報検索装置
発明者:
,
出願人/特許権者:
代理人 (1件):
酒井 昭徳
公報種別:公開公報
出願番号(国際出願番号):特願2009-296410
公開番号(公開出願番号):特開2011-138230
出願日: 2009年12月25日
公開日(公表日): 2011年07月14日
要約:
【課題】データのファイルサイズの縮小と検索ノイズの低減化とを図ること。【解決手段】(A)は分割前の2グラムの圧縮符号マップのサイズを示しているが、210×210(=220)のサイズが必要となり、サイズ爆発を引き起こすこととなる。(B)では、第2グラムの圧縮符号マップへのポインタを5ビットで分割している。したがって、サイズは、210×25×2(=216)となり、大幅なサイズ縮小を図ることができる。(B)の場合、分割された2つのマップによりAND演算することで、絞込みをおこなうことができる。(C)では、さらに、第1グラムの圧縮符号マップへのポインタを5ビットで分割している。したがって、サイズは、25×25×4(=212)となり、大幅なサイズ縮小を図ることができる。(C)の場合、分割された4つのマップによりAND演算することで、絞込みをおこなうことができる。【選択図】図40
請求項(抜粋):
コンピュータを、
文字コード列が記述されている対象ファイル群を記憶する記憶手段、
前記対象ファイル群の中から選ばれた一の対象ファイル内の連続する2グラムの文字コード列を構成する先行文字コードおよび後続文字コードの各識別情報のうち、少なくともいずれか一方の識別情報を2分割して前記他方の識別情報と組み合わせ、複数種類の組み合わせ識別情報を生成する生成手段、
前記生成手段によって生成された複数種類の組み合わせ識別情報に対して、前記対象ファイル群のファイル数分のビット列をそれぞれ割り当てて、複数種類の連続グラム分割マップとし、前記記憶手段に記憶するマップ特定手段、
前記マップ特定手段によって特定された複数種類の連続グラム分割マップにおいて、前記連続する2グラムの文字コード列の前記一の対象ファイルでの存否をあらわすビットを更新する更新手段、
として機能させることを特徴とする情報処理プログラム。
IPC (2件):
FI (3件):
G06F12/00 511A
, G06F17/30 170H
, G06F17/30 414B
Fターム (4件):
5B075ND18
, 5B075NK49
, 5B082AA11
, 5B082GA01
前のページに戻る