特許
J-GLOBAL ID:200903098166839268
構造化文書の分割プログラム、分割装置、及び分割方法
発明者:
,
出願人/特許権者:
代理人 (1件):
酒井 宏明
公報種別:公開公報
出願番号(国際出願番号):特願2004-197092
公開番号(公開出願番号):特開2005-025763
出願日: 2004年07月02日
公開日(公表日): 2005年01月27日
要約:
【課題】構造化文書の構造及び繰り返しパターンが比較的複雑で、情報ブロックが完全には互いに整合していなくても、構造化文書中の情報ブロックの識別と分割とを正確に実行することを課題する。【解決手段】構造化文書の分割装置は、構造化文書を受け取って、当該構造化文書の文書構造情報を当該構造化文書に基づいて生成する文書構造情報生成ユニット1と、文書構造情報生成ユニット1によって生成された文書構造情報に基づいて、情報ブロックの範囲を判定する情報ブロック範囲判定ユニット2と、文書構造情報生成ユニット1によって生成された文書構造情報と、情報ブロック範囲判定ユニット2によって判定された範囲とに基づいて、分割基準を生成する分割基準生成ユニット3と、この分割基準生成ユニット3によって生成された分割基準に基づいて、構造化文書を分割してその結果を出力する分割ユニット4とを備える。【選択図】図1
請求項(抜粋):
コンピュータを、
前記構造化文書を受け取って、当該構造化文書の文書構造情報を当該構造化文書に基づいて生成する文書構造情報生成手段と、
前記文書構造情報生成手段によって生成された前記文書構造情報に基づいて、前記情報ブロックの範囲を判定する情報ブロック範囲判定手段と、
前記文書構造情報生成手段によって生成された前記文書構造情報と、前記情報ブロック範囲判定手段によって判定された前記範囲とに基づいて、分割基準を生成する分割基準生成手段と、
前記分割基準生成手段によって生成された前記分割基準に基づいて、前記構造化文書を分割してその結果を出力する分割手段と、
として機能させるための構造化文書分割プログラム。
IPC (2件):
FI (2件):
G06F17/21 501T
, G06F17/30 140
Fターム (4件):
5B009QA06
, 5B075ND03
, 5B075ND35
, 5B075NS10
引用特許:
前のページに戻る