特許
J-GLOBAL ID:200903068571781270

構造化文書生成方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 小川 勝男
公報種別:公開公報
出願番号(国際出願番号):特願平7-223017
公開番号(公開出願番号):特開平9-069101
出願日: 1995年08月31日
公開日(公表日): 1997年03月11日
要約:
【要約】【目的】非構造化文書から構造化文書への変換を、予め設定された論理構造定義から直接的に作成したルールを用いて行い、個々の文書の論理構造に即した構造化文書の作成を容易にする。【構成】キーワード抽出部102は、キーワード抽出ルール103を用いて非構造化文書101から論理構造を表すキーワードを抽出し、非構造化文書101をキーワードとそれ以外の文字列の二種の要素で表現したキーワード/テキストモデル104を生成する。DTD106を修正・変換して作成した構文解析ルール110を参照して構文解析部自動生成手続き113が生成した構文解析部105は、キーワード/テキストモデル104に対する構文解析を行い、仮SGML文書114を生成する。SGML文書修正部115は、構文解析ルール作成時に生成されたDTD差分情報109を参照して仮SGML文書113を修正し、最終出力であるSGML文書116を生成する。
請求項(抜粋):
少なくとも入力表示装置、制御装置、および記憶装置を含み、文書の論理構造を規定する論理構造定義に基づき、構造が明示されていない文書である非構造化文書を前記入力表示装置により入力し、入力された非構造化文書を構造が明示されている文書である構造化文書に変換し、前記構造化文書を出力する構造化文書生成装置において、予め与えられた第1の論理構造定義を、入力された非構造化文書の文書構造に適合させて修正して第2の論理構造定義を作成し、作成された第2の論理構造定義を構成する記号および該記号の配列順序と1対1に対応すべく前記第2の論理構造定義を変形して前記第2の論理構造定義が規定する論理構造に適合した構文解析を行うための構文解析ルールを前記制御装置にて生成し、生成された構文解析ルールに基づき、入力された前記非構造化文書から第1の構造化文書を生成し、生成された第1の構造化文書を、前記第1の論理構造定義と前記第2の論理構造定義との差分データに基づき、前記第1の論理構造定義に従う形式に変換して第2の構造化文書を生成することを特徴とする構造化文書生成方法。
FI (2件):
G06F 15/20 550 F ,  G06F 15/20 550 A

前のページに戻る