特許
J-GLOBAL ID:200903021812583312
構造化文書の圧縮/解凍方法
発明者:
,
出願人/特許権者:
代理人 (1件):
斎藤 晴男
公報種別:公表公報
出願番号(国際出願番号):特願2002-526128
公開番号(公開出願番号):特表2004-508647
出願日: 2001年08月31日
公開日(公表日): 2004年03月18日
要約:
本発明は、情報のタイプと関連付けられ、データ・セットを表すネストになった構造要素を含み、文書構造を定義する少なくとも1つのツリー図構造(1、31、39、43)と関連付けられた構造化文書を圧縮および解凍する方法に関し、この方法は、構造図の構文解析(11)を行い、構造図を標準化(12)して図の要素の単一の所定の順番を得るステップと、標準化した図をコンパイル(13)して有限オートマトン(5)を得、各オートマトンは、それぞれが構造の要素を表す遷移(m1、m2..mn)によって相互に連結された状態(0、1、n)を含むステップと、文書を圧縮(15)し、文書(2)中である情報タイプのデータ・セットに遭遇した際は、前記情報タイプと関連付けられた少なくとも1つの圧縮アルゴリズム(16)を実行するステップとを含む。
請求項(抜粋):
文書の構造を定義し、文書のデータ・セットを表すネストになった構造要素(32、33、34、40、44、45、46、a3、a4、X、Y、a1、a5、a1、a2、A、B)を含む少なくとも1つの木構造スキーマ(1;31、39、43)と関連付けられた構造化文書を圧縮および解凍する方法であって、構造要素は、3つのカテゴリ、すなわち、構造化されたルート要素(31、39、43)、要素のグループ(32、33、34、40、44、45、46)、および、構造中の最下位レベルの要素に対応する構造化された(X、Y、A、B)または非構造化(a3、a4、a1、a5、a1、a2)基本要素、に分類され、各基本要素は情報タイプと関連付けられ、基本要素の少なくとも1つの情報タイプを初めに適合された圧縮アルゴリズム(16)と関連付け、
-文書の構造スキーマの構文解析(11)を行うステップ、
-正規化した構造スキーマをコンパイル(13)して、1つのルート要素につき1つの有限オートマトン(5)を得、各オートマトンは、それぞれが構造要素を表す遷移(「m1」、「m2」、〜「mn」)によって相互に連結された状態(「0」、「1」、〜「n」)を含むステップ、および
-文書に有限オートマトン(5)を実行することを含めて圧縮のために構造化文書(2)を圧縮(15)し、前記アルゴリズムと関連づけられた情報タイプのデータ・セットに構造化文書(2)中で遭遇すると前記圧縮アルゴリズム(16)を実行するステップ
を含むことを特徴とする方法。
IPC (1件):
FI (1件):
引用特許:
引用文献:
前のページに戻る