特許
J-GLOBAL ID:200903023453563494

構造化文書の圧縮方法および圧縮装置並びに構造化文書圧縮プログラムを記録したコンピュータ読取可能な記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 真田 有
公報種別:公開公報
出願番号(国際出願番号):特願2007-311608
公開番号(公開出願番号):特開2008-084341
出願日: 2007年11月30日
公開日(公表日): 2008年04月10日
要約:
【課題】構造化文書の特徴を損なうことなくタグ部分の圧縮を可能にし、構造化文書の圧縮率の向上をはかる。【解決手段】構造化文書を成す文書実現値のタグ内の記述を解析する文書実現値解析部20と、この文書実現値解析部20による解析結果に従って、該文書実現値のタグ内に記述された文字列と該文字列よりも短く且つ該文字列を特定しうる短縮文字列とを対応させるタグ辞書を作成するタグ辞書作成部80と、このタグ辞書作成部80により作成された該タグ辞書を用いて、該文書実現値のタグ内に記述された文字列を、当該文字列に対応する短縮文字列に置き換える文書実現値文字列置換部41とをそなえて構成する。【選択図】図14
請求項(抜粋):
構造化文書を圧縮する方法であって、 該構造化文書を成す文書実現値のタグ内の記述を解析する文書実現値解析ステップと、 該文書実現値解析ステップでの解析結果に従って、該文書実現値のタグ内に記述された文字列と該文字列よりも短く且つ該文字列を特定しうる短縮文字列とを対応させるタグ辞書を作成するタグ辞書作成ステップと、 該タグ辞書作成ステップで作成された該タグ辞書を用いて、該文書実現値のタグ内に記述された文字列を、当該文字列に対応する短縮文字列に置き換える文書実現値文字列置換ステップとを有することを特徴とする、構造化文書の圧縮方法。
IPC (3件):
G06F 17/21 ,  G06F 17/24 ,  G06F 12/00
FI (4件):
G06F17/21 570G ,  G06F17/21 501Z ,  G06F17/24 554H ,  G06F12/00 511A
Fターム (4件):
5B009ME06 ,  5B009SA08 ,  5B009TA13 ,  5B082GA01
引用特許:
審査官引用 (4件)
全件表示

前のページに戻る