特許
J-GLOBAL ID:200903039906545720

文書型の同定装置

発明者:
出願人/特許権者:
代理人 (1件): 小堀 益 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-155941
公開番号(公開出願番号):特開平9-006784
出願日: 1995年06月22日
公開日(公表日): 1997年01月10日
要約:
【要約】【目的】 文書型を表現するテキストが相違している場合でも文書型の等価性を判断することができる文書型の同定装置を提供すること。【構成】 文書型解析手段により、テキスト形式で表現された文書型もしくは文書型を含む文書を解析し、解析木に変換する。次に、正規化手段により、得られた解析木を正規化して出力する。ここで正規化とは、文書の論理構造に影響を及ぼさない文書要素の削除、文書要素の規定した順序での整列、内容モデルでの「出現順序を問わない」構成子の子の規定した順序での整列を意味する。そして、正規化表現比較手段により、得られた正規化表現の比較を行う。文書型は正規化されていることから、単純な完全一致比較が可能である。
請求項(抜粋):
複数のテキスト形式で表現された文書型もしくは文書型を含む文書を入力し、その文書型の同定を行う装置において、テキスト形式で表現された文書型もしくは文書型を含む文書を解析し、解析木に変換する文書型解析手段と、前記文書型解析手段により生成された解析木を正規化して出力する正規化手段と、前記正規化手段により生成された正規化表現を比較する正規化表現比較手段とを具備することを特徴とする文書型の同定装置。
IPC (2件):
G06F 17/27 ,  G06F 17/21
FI (2件):
G06F 15/20 550 F ,  G06F 15/20 530 E

前のページに戻る