特許
J-GLOBAL ID:200903064872967218

文字データの圧縮・復元方法

発明者:
出願人/特許権者:
代理人 (1件): 長澤 俊一郎 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-207654
公開番号(公開出願番号):特開平11-055125
出願日: 1997年08月01日
公開日(公表日): 1999年02月26日
要約:
【要約】【課題】 辞書型符号化、確率統計型符号化方式を用いてデータを圧縮するに際し、小さいデータでも高い圧縮率を得ることができるようにすること。【解決手段】 原データを文字判別部11で判別して内部番号列に変換し、辞書型符号化部12で符号化する。また、内部番号に変換された文字列が辞書に保持されていない場合には、グループ特定部13で2つのグループに分け、8ビット符号化部14、13ビット符号化部15において、ひらがな、漢字等の文字を符号化し、グループを示すビットを付して出力する。データを復元する場合は、辞書型復元部22において、圧縮データを復元して内部番号を得るとともに、圧縮データが辞書符号でない場合には、グループ特定部21でグループを特定しグループ毎に復号を行い、文字コード変換部25で文字コードに変換する。なお、確率統計型符号化方式によるデータ圧縮にも同様に適用することができる。
請求項(抜粋):
文字コードおよび制御コードから構成される入力データを、そのコードに対応する内部番号列に変換し、辞書に保持されている過去に出現した内部番号列の中から、上記内部番号列に一致するものを検索し、上記辞書に上記内部番号列が保持されている場合には、上記内部番号列を、上記辞書における上記内部番号の格納位置もしくは該位置に対応した番号と、一致長に相当する符号に変換して出力し、上記辞書に上記内部番号列が保持されていない場合には、未保持を示す符号を出力したのち、上記各内部番号を第1のグループと第2のグループの2つのグループに分け、各内部番号を、そのグループを表すビットと下記Lpビットからなる符号に変換し2の(Lp-1)乗<Np<2のLp乗(Npはグループpに属する文字の数、pは0または1)上記各内部番号に対応する(Lp+1)ビットの符号を出力することを特徴とする文字データの圧縮方法。

前のページに戻る