特許
J-GLOBAL ID:200903081943607287

文書データの符号化又は復号化方法及びそのプログラム

発明者:
出願人/特許権者:
代理人 (1件): 山本 恵一
公報種別:公開公報
出願番号(国際出願番号):特願2004-021240
公開番号(公開出願番号):特開2005-215951
出願日: 2004年01月29日
公開日(公表日): 2005年08月11日
要約:
【課題】 XML文書データの文法特性を利用して、符号化圧縮率をより向上させた文書データの符号処理方法及びプログラムを提供する。【解決手段】 要素名と属性名とに対応する符号が指定されているXMLの変換シートを用いて、XML原文書データを符号化するために、最初に、原文書データのタグ単位で、要素名及び属性名と、該属性名に対応する値とを検出する。次に、要素名から変換シートを用いて導出された符号と、属性名の存在の有無をビットで表した符号とを組み合わせた第1の符号を構造テーブルに順に記録する。次に、存在する属性名に対応する値を出現頻度に応じて符号化した第2の符号を、第1の符号を記録した構造テーブルのエントリにリンクした、値テーブルのエントリに記録する。更に、第1のステップから第3のステップを繰り返すことによって生成された構造テーブル及び値テーブルを符号データとする。【選択図】 図2
請求項(抜粋):
拡張可能なテキスト形式の構造型記述言語で記載された原文書データを符号化する文書データ符号化方法において、 拡張可能なテキスト形式の構造型記述言語で記載され、要素名と、該要素名に指定可能な属性名とに対応する符号が指定されている変換シートと、 要素毎の構造符号をエントリにエントリに記録する構造テーブルと、 前記構造テーブルのエントリに対応して、属性値又は要素値の符号をエントリに記録する値テーブルと を用いて、前記原文書データのタグ単位順に、 要素名と、子要素又は要素値の有無と、属性名の有無と、存在する属性値又は要素値とを検出する第1のステップと、 前記要素名から前記変換シートを用いて導出された符号と、該要素名の子要素又は要素値の有無を表す符号と、前記属性名の有無を表す符号とを組み合わせた前記構造符号を、前記構造テーブルのエントリに順に記録する第2のステップと、 存在する前記属性値又は要素値に対する符号を、前記値テーブルに記録する第3のステップと を有し、前記第1のステップから前記第3のステップを繰り返すことによって生成された前記構造テーブル及び前記値テーブルを符号データとすることを特徴とする文書データの符号化方法。
IPC (4件):
G06F5/00 ,  G06F12/00 ,  G06F17/21 ,  H03M7/30
FI (6件):
G06F5/00 H ,  G06F12/00 511A ,  G06F12/00 547Z ,  G06F17/21 501T ,  G06F17/21 570G ,  H03M7/30 Z
Fターム (10件):
5B009QA06 ,  5B009SA08 ,  5B082GA02 ,  5B082HA08 ,  5J064AA02 ,  5J064BA09 ,  5J064BC01 ,  5J064BC25 ,  5J064BC29 ,  5J064BD05
引用特許:
出願人引用 (1件) 審査官引用 (7件)
全件表示

前のページに戻る