Pat
J-GLOBAL ID:200903098166839268

構造化文書の分割プログラム、分割装置、及び分割方法

Inventor:
Applicant, Patent owner:
Agent (1): 酒井 宏明
Gazette classification:公開公報
Application number (International application number):2004197092
Publication number (International publication number):2005025763
Application date: Jul. 02, 2004
Publication date: Jan. 27, 2005
Summary:
【課題】構造化文書の構造及び繰り返しパターンが比較的複雑で、情報ブロックが完全には互いに整合していなくても、構造化文書中の情報ブロックの識別と分割とを正確に実行することを課題する。【解決手段】構造化文書の分割装置は、構造化文書を受け取って、当該構造化文書の文書構造情報を当該構造化文書に基づいて生成する文書構造情報生成ユニット1と、文書構造情報生成ユニット1によって生成された文書構造情報に基づいて、情報ブロックの範囲を判定する情報ブロック範囲判定ユニット2と、文書構造情報生成ユニット1によって生成された文書構造情報と、情報ブロック範囲判定ユニット2によって判定された範囲とに基づいて、分割基準を生成する分割基準生成ユニット3と、この分割基準生成ユニット3によって生成された分割基準に基づいて、構造化文書を分割してその結果を出力する分割ユニット4とを備える。【選択図】図1
Claim (excerpt):
コンピュータを、 前記構造化文書を受け取って、当該構造化文書の文書構造情報を当該構造化文書に基づいて生成する文書構造情報生成手段と、 前記文書構造情報生成手段によって生成された前記文書構造情報に基づいて、前記情報ブロックの範囲を判定する情報ブロック範囲判定手段と、 前記文書構造情報生成手段によって生成された前記文書構造情報と、前記情報ブロック範囲判定手段によって判定された前記範囲とに基づいて、分割基準を生成する分割基準生成手段と、 前記分割基準生成手段によって生成された前記分割基準に基づいて、前記構造化文書を分割してその結果を出力する分割手段と、 として機能させるための構造化文書分割プログラム。
IPC (2):
G06F17/21 ,  G06F17/30
FI (2):
G06F17/21 501T ,  G06F17/30 140
F-Term (4):
5B009QA06 ,  5B075ND03 ,  5B075ND35 ,  5B075NS10
Patent cited by the Patent:
Cited by examiner (3)

Return to Previous Page