特許
J-GLOBAL ID:200903048288997630

テキストデータの圧縮方法および復元方法

発明者:
出願人/特許権者:
代理人 (1件): 深見 久郎
公報種別:公開公報
出願番号(国際出願番号):特願平3-172857
公開番号(公開出願番号):特開平5-046357
出願日: 1991年07月15日
公開日(公表日): 1993年02月26日
要約:
【要約】【目的】 データの出現パターンと関係なく効率よくテキストを圧縮し、柔軟かつ正確に復元する。【構成】 バッファ15に格納されたテキストを単語に分割し、自立語辞書11に含まれる単語をそのアドレスに変換して出力バッファ9に順次出力してテキストを圧縮する。圧縮されたテキストをディスク14に出力する際には、辞書11を特定する識別情報を識別情報付加部4によって付加する。復元時には、識別情報に基づき、復元と圧縮の際の辞書11が同一か否かを判断し、異なる場合には2つの辞書のアドレスを置換するためのテーブル12を用意する。テキスト中の辞書アドレスは辞書アドレス置換部7によってテーブル12を参照して復元時の辞書11の対応アドレスに変換される。そのアドレスに格納された単語を文章復元部6によってテキストデータに取込むことにより、圧縮されたテキストデータが復元される。
請求項(抜粋):
各々が、見出しとしてのコード化された第1の文字列と、前記第1の文字列と1対1の対応関係によって対応づけられ、前記第1の文字列よりもそのデータ長の短い文字列対応データとを含む複数の文字列変換対を含む文字列変換辞書を準備するステップと、1文字単位にコード化されたテキストデータを受け、前記テキストデータを単語単位の入力文字列に分割するステップと、前記入力文字列と一致する前記文字列変換辞書中の前記第1の文字列を検索するステップと、前記検索された第1の文字列に対応する前記文字列対応データによって前記入力文字列を置換し、それによって前記テキストデータを圧縮するステップと、前記準備された文字列変換辞書の種類を識別するための識別情報を前記圧縮されたテキストデータに付加するステップとを含むテキストデータの圧縮方法。
IPC (3件):
G06F 5/00 ,  G06F 15/20 570 ,  H03M 7/30
引用特許:
審査官引用 (4件)
  • 特開平1-102613
  • 特開平2-047736
  • 特開昭64-059437
全件表示

前のページに戻る