特許
J-GLOBAL ID:201103072357687637
有損失インデックス圧縮装置
発明者:
,
,
,
,
,
,
出願人/特許権者:
代理人 (4件):
上野 剛史
, 太佐 種一
, 市位 嘉宏
, 坂口 博
公報種別:特許公報
出願番号(国際出願番号):特願2002-555320
特許番号:特許第4080878号
出願日: 2001年12月19日
請求項(抜粋):
【請求項1】 テキスト・ドキュメントのコーパスをインデックス化するための装置であって、
前記ドキュメントに現れるタームの逆インデックスを作成するように構成されたインデックス・プロセッサと、
少なくとも1つのパラメータであって、プルーニングされた逆インデックスにおいて残すべきスコアの数Mを含むパラメータを受け取るためのユーザ・インターフェースを含み、
前記インデックスは、各タームについて、当該タームを含むドキュメントの識別子及び当該ドキュメントにおける前記タームの前記スコアを含むポスティングのリストを含み、
前記プロセッサは、実行依頼された照会の統計分布に関する情報に基づいて、前記タームの少なくとも幾つかの、照会に出現する確率を決定し、前記タームの少なくとも幾つかの各々についてポスティング・スコアを前記タームの前記確率によって乗じ、前記乗じられたポスティング・スコアによってすべてのポスティングをランク付け、前記ランキングにおける所与のレベルよりも低い前記ポスティングを前記インデックスからプルーニングし、
前記所与のレベルは、前記ランキングのトップからMのドキュメントのスコアを含む、
装置。
IPC (1件):
FI (2件):
G06F 17/30 414 B
, G06F 17/30 170 A
引用特許:
引用文献:
前のページに戻る