特許
J-GLOBAL ID:200903052895957653

テキストデータの圧縮方法

発明者:
出願人/特許権者:
代理人 (1件): 深見 久郎
公報種別:公開公報
出願番号(国際出願番号):特願平3-172858
公開番号(公開出願番号):特開平5-046358
出願日: 1991年07月15日
公開日(公表日): 1993年02月26日
要約:
【要約】【目的】 テキストデータ内のデータ出現パターンに関わりなく効率よくテキストデータを圧縮する。【構成】 S01において入力されたテキストデータを、S02において単語に分割する。続いてS04において、分割された単語が予め用意された辞書内にあるかどうか検索し、S05においてあったか否かを判断する。一致した見出しが辞書内にあった場合には、S06においてテキストデータ内のその単語が辞書内の、その単語に割当てられたアドレスに変換されて出力される。単語が辞書内にない場合には、S06と異なる、別に用意された未登録語処理がS07において行なわれる。S04において参照される辞書にある単語は、この方法により効率よく短いデータに圧縮できる。
請求項(抜粋):
各々が、見出しとしてのコード化された第1の文字列と、前記第1の文字列と1対1の対応関係により対応づけられ、前記第1の文字列よりもそのデータ長の短い文字列対応データとを含む複数個の文字列変換対を含む文字列変換辞書を準備するステップと、1文字単位にコード化されたテキストデータを受け、前記テキストデータを単語単位の入力文字列に分割するステップと、前記入力文字列と一致する前記文字列変換辞書中の前記第1の文字列を検索するステップと、前記検索された第1の文字列に対応する前記文字列対応データによって前記入力文字列を置換し、それによって前記テキストデータを圧縮するステップとを含むテキストデータの圧縮方法。
IPC (3件):
G06F 5/00 ,  G06F 15/20 570 ,  H03M 7/30

前のページに戻る