特許
J-GLOBAL ID:200903068322735099

日本語情報圧縮方式

発明者:
出願人/特許権者:
代理人 (1件): 京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-073686
公開番号(公開出願番号):特開平7-282040
出願日: 1994年04月13日
公開日(公表日): 1995年10月27日
要約:
【要約】【目的】日本語情報を分析して短文・文節・単語単位でコード変換を行うことにより、より高密な圧縮を可能とする。【構成】文書ファイル読込み手段2は文書ファイル1に格納されている圧縮対象となる日本語情報を“文”の単位で分析し、短文・文節・単語の単位で文字列符号化処理手段4に符号化要求を行う。文字列変換手段6は対象文字列について文字列変換用辞書5を検索し、ヒットしたときには符号表の変換コードを取り出し、属性コードを付加した日本語情報を圧縮後日本語情報として圧縮ファイル7に格納する。
請求項(抜粋):
日本語コードが1文字2バイトで表現された日本語情報を圧縮する日本語情報圧縮方式において、前記日本語情報を日本語文法に基づいて文の単位で分析して短文・文節・単語単位でコード変換対象文字列を抽出する文字列検出処理手段と、統計的研究に基づいて作成された文字列変換用辞書を索引して前記文字列検出処理手段が抽出した2文字以上の文字列を符号化する文字列符号化処理手段とを備えることを特徴とする日本語情報圧縮方式。
引用特許:
審査官引用 (5件)
  • 特開平3-038772
  • 特開平2-255964
  • 特開昭64-028751
全件表示

前のページに戻る