Pat
J-GLOBAL ID:200903048288997630
テキストデータの圧縮方法および復元方法
Inventor:
,
,
Applicant, Patent owner:
Agent (1):
深見 久郎
Gazette classification:公開公報
Application number (International application number):1991172857
Publication number (International publication number):1993046357
Application date: Jul. 15, 1991
Publication date: Feb. 26, 1993
Summary:
【要約】【目的】 データの出現パターンと関係なく効率よくテキストを圧縮し、柔軟かつ正確に復元する。【構成】 バッファ15に格納されたテキストを単語に分割し、自立語辞書11に含まれる単語をそのアドレスに変換して出力バッファ9に順次出力してテキストを圧縮する。圧縮されたテキストをディスク14に出力する際には、辞書11を特定する識別情報を識別情報付加部4によって付加する。復元時には、識別情報に基づき、復元と圧縮の際の辞書11が同一か否かを判断し、異なる場合には2つの辞書のアドレスを置換するためのテーブル12を用意する。テキスト中の辞書アドレスは辞書アドレス置換部7によってテーブル12を参照して復元時の辞書11の対応アドレスに変換される。そのアドレスに格納された単語を文章復元部6によってテキストデータに取込むことにより、圧縮されたテキストデータが復元される。
Claim (excerpt):
各々が、見出しとしてのコード化された第1の文字列と、前記第1の文字列と1対1の対応関係によって対応づけられ、前記第1の文字列よりもそのデータ長の短い文字列対応データとを含む複数の文字列変換対を含む文字列変換辞書を準備するステップと、1文字単位にコード化されたテキストデータを受け、前記テキストデータを単語単位の入力文字列に分割するステップと、前記入力文字列と一致する前記文字列変換辞書中の前記第1の文字列を検索するステップと、前記検索された第1の文字列に対応する前記文字列対応データによって前記入力文字列を置換し、それによって前記テキストデータを圧縮するステップと、前記準備された文字列変換辞書の種類を識別するための識別情報を前記圧縮されたテキストデータに付加するステップとを含むテキストデータの圧縮方法。
IPC (3):
G06F 5/00
, G06F 15/20 570
, H03M 7/30
Patent cited by the Patent: