セパレータが無いか少ない言語を表わすコンピュータファイルのためのデータ圧縮方法

発明者：
出願人/特許権者：
代理人 (1件)：土屋勝
公報種別：公開公報
出願番号（国際出願番号）：特願平5-110048
公開番号（公開出願番号）：特開平6-131152
出願日： 1993年04月13日
公開日（公表日）： 1994年05月13日
要約：

【要約】【構成】日本語の文書用言語のように複数のアルファベットを含みかつセパレータが無い文書用言語を表わす文字セットからの文字を備えたコンピュータファイルのためのデータ圧縮技術に関する。日本語またはその類似の言語のアルファベットは、分離ブロックに写像されるので、1つのセグメントからつぎのセグメントへの変化は、識別(すなわち、同定)が可能である。それぞれの特有なセグメントは、特有な数を割り当てられてセグメントの辞書に加えられる。辞書は、対応する特有な数に対して相互参照される特有なセグメントのリストを備え、そして、元のファイルのそれぞれのセグメントは、それを表わす特有な数に置換される。【効果】日本語のようなセパレータが無いか少ない言語でも簡単に圧縮することができる。

請求項（抜粋）：

セパレータ記号が無いか少ない複数のアルファベットを含む言語を表わす文字セットからの文字の列を備えたコンピュータファイルを圧縮する方法であって、(a) 前の文字と同一のアルファベットには関連していない最初の文字が読み取られるまで(この場合、同一のアルファベットの連続した文字の読み取りがセグメントを定義している。)、文字の列からそれぞれの文字を読み取るステップと、(b) 複数の対応する特有な数に対して相互参照される文字の特有なセグメントの複数を備えた辞書を上記セグメントのために探索するステップと、(c) 上記セグメントが上記辞書中に見つかれば、対応する特有な数を上記辞書から検索し、そして、上記セグメントが見つからなければ、対応する特有な数を上記セグメントに割り当てると共に、上記セグメントおよび上記対応する特有な数を上記辞書に付加するステップと、(d) 上記セグメントをその対応することを表わす特有な数と置換するステップと、(e) 前のセグメントの最後の文字の後で読み取られる最初の文字が新しいセグメントを始めるときに、上記コンピュータファイルの終端まで上記ステップ(a)〜(d)を繰り返すステップとを備えることを特徴とするデータ圧縮方法。

IPC (4件)：

G06F 5/00 , G06F 12/00 511 , G06F 12/04 530 , G06F 15/20 570

引用特許：

審査官引用 (3件)

特開昭58-022434
特開平2-255977
特開昭61-242122

前のページに戻る