特許
J-GLOBAL ID:200903023360399660

複数種類データのデータ圧縮方法

発明者:
出願人/特許権者:
代理人 (1件): 竹内 進 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-183288
公開番号(公開出願番号):特開平6-028149
出願日: 1992年07月10日
公開日(公表日): 1994年02月04日
要約:
【要約】【目的】LZW符号等の動的辞書型アルゴリズムを用いて入力データを圧縮符号化する複数種類データのデータ圧縮方法に関し、複数種類のデータを対象に調べた高頻度に出現する文字列を初期登録した符号化における辞書探索を一本化し、処理時間を増加させることなく高い圧縮率が得られるようにする。【構成】サンプルデータ1,2のLZW符号化で検出した出現頻度が、複数種類のデータで共通に高頻度となる部分列を共通部分列群S00として抽出して辞書領域A0 に初期登録する。また複数種類のデータ毎に高頻度となる部分列を固有部分列群S10,S20として抽出して辞書領域A1 ,A2 に初期登録する。データ1,2が混在する入力文字列を符号化する際には、入力文字列に最長一致する登録済み部分列を辞書から検索し、検索した部分列の属する部分列群の群番号jと部分列群内での検索文字列の登録番号iとを用いて入力文字列を符号化する。
請求項(抜粋):
複数種類のデータが混在する入力データを符号化して圧縮する複数種類データのデータ圧縮方法に於いて、複数種類の各データを相異なる部分列に分けて辞書に登録し、各データ毎に入力文字列に最長一致する辞書に登録済みの部分列を検索し、検索した部分列の登録番号で表わして入力文字列を圧縮符号化し、該符号化における部分列の出現頻度を検出する第1過程と、前記第1過程で検出した出現頻度が、複数種類のデータで共通に高頻度となる部分列を共通部分列群(S00)として抽出し、該共通部分列群(S00)に特定の群番号(j=0)を付けて辞書領域(A0 )を確保し、該辞書領域(A0 )に該共通部分列群(S00)に属する各部分列を初期登録し、また前記第1過程で検出した出現頻度が、複数種類のデータ毎に高頻度となる部分列を固有部分列群(S10,S20)として抽出し、各固有部分列群(S10,S20)毎に特定の群番号(j=1,2)を付けて辞書領域(A1 ,A2 )を確保し、該辞書領域(A1 ,A2)に該当する固有部分列群(S10,S20)に属する各部分列を初期登録する第2過程と、複数種類のデータが混在する入力文字列を符号化する際に、入力文字列に最長一致する登録済み部分列を前記辞書から検索し、検索した部分列の属する部分列群(S00,S10,S20)の群番号(j=0,1,2)と該部分列群内での検索文字列の登録番号(ij )とを用いて入力文字列を符号化する第3過程と、を備えたことを特徴とする複数種類データのデータ圧縮方法。
IPC (3件):
G06F 5/00 ,  G06F 15/66 330 ,  H03M 7/30

前のページに戻る