特許
J-GLOBAL ID:200903091287182270

文書データの圧縮方法及びその装置

発明者:
出願人/特許権者:
代理人 (1件): 小谷 悦司 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-050851
公開番号(公開出願番号):特開平7-306854
出願日: 1995年03月10日
公開日(公表日): 1995年11月21日
要約:
【要約】【目的】 表示用文書として予め作成される文書データのデータ量を低減し、メモリの有効利用を図る。【構成】 制御部1は入力装置2から入力された文書に含まれる単語と当該単語の発現数とを演算する。また、文字データに割り当てられたコードと異なるコードを各単語に割り振り、各単語について第1総ワード数W1(=単語のワード数Nw×発現数Ni)と第2総ワード数W2(=コードのワード数Nc×発現数Ni+ワード数Nw)とを演算する。そして、入力文書を構成する文字データのうち、第2総ワード数W2が第1総ワード数W1より小さい単語を構成する部分は当該単語に割り振られたコードに置換して文書データを圧縮する。文書全体で総ワード数が少なくなる単語を当該単語を示すコードに置換することより文書データのデータ量を低減するようにした。
請求項(抜粋):
所定のコード表で定義された文字データにより予め作成された複数の文書データを、当該文書データに含まれる一部の単語を単語単位でコード化することにより圧縮する文書データの圧縮方法であって、全文書データに含まれる単語から単語単位でコード化すべき単語を抽出する単語抽出工程と、抽出した各単語に、上記コード表のコードであって上記文字データに割り当てられたコードと異なるコードを割り振るコード割振工程と、コード化された単語と当該単語に割り振られたコードとの対応関係を示す辞書を作成する辞書作成工程と、文書データを構成する単語のうち、上記単語抽出工程で抽出した単語を当該単語に割り振られたコードに置換して各文書データをコード混じりの文書データに圧縮する文書データ圧縮工程とからなることを特徴とする文書データの圧縮方法。
IPC (3件):
G06F 17/21 ,  G06F 5/00 ,  H03M 7/46

前のページに戻る