特許
J-GLOBAL ID:200903068363393844

テキスト圧縮用辞書作成装置およびテキスト圧縮装置

発明者:
出願人/特許権者:
代理人 (1件): 深見 久郎
公報種別:公開公報
出願番号(国際出願番号):特願平8-013892
公開番号(公開出願番号):特開平9-212395
出願日: 1996年01月30日
公開日(公表日): 1997年08月15日
要約:
【要約】【課題】 大容量の固定テキストの圧縮率を飛躍的に向上させるためのテキスト圧縮用辞書作成装置およびテキスト圧縮装置を提供する。【解決手段】 目標圧縮率を満足するためにテキスト中で出現が要求される頻度のガイドラインを算出する頻度ガイドライン算出手段111と、テキストから対応する文字列長の頻度ガイドラインを満たす頻度で出現するものをその実頻度とともに文字列長の降順に切出して静的辞書を生成する長文字列切出手段112とを含む。
請求項(抜粋):
テキストを圧縮する際に参照される辞書を作成するためのテキスト圧縮用辞書作成装置であって、目標圧縮率に対して、2以上の文字列長の各々について前記目標圧縮率を満足するためにテキスト中で出現が要求される頻度のガイドラインを算出する頻度ガイドライン算出手段と、テキストから、文字列長2以上の文字列であって、対応する文字列長の頻度ガイドラインを満たす頻度で出現するものを、その実頻度とともに文字列長の降順に切出して第1の静的辞書を生成するとともに、前記頻度ガイドラインを満たさない切残しのテキストの集合を生成する長文字列切出手段と、前記切残しのテキストの集合から文字列長1の文字ごとにその頻度をカウントして第2の静的辞書を生成する1文字シンボル抽出手段と、前記第1の静的辞書に前記第2の静的辞書を追加して最終的静的辞書を生成する最終的静的辞書構築手段とを含むテキスト圧縮用辞書作成装置。
IPC (2件):
G06F 12/00 511 ,  G06F 17/21
FI (2件):
G06F 12/00 511 ,  G06F 15/20 570 G
引用特許:
出願人引用 (7件)
全件表示
審査官引用 (7件)
全件表示

前のページに戻る