Pat
J-GLOBAL ID:201103076867882626

文書の論理構造の解析方法及びシステム

Inventor:
Applicant, Patent owner:
Agent (1): 合田 潔 (外2名)
Gazette classification:特許公報
Application number (International application number):1994134014
Publication number (International publication number):1996006945
Patent number:2618832
Application date: Jun. 16, 1994
Publication date: Jan. 12, 1996
Claim (excerpt):
【請求項1】コンピュータ・システムによって可読な形式で格納された文書の論理構造を、コンピュータ・システムの処理によって解析するための方法において、(a) 文書中の行ごとに、少なくとも,当該行の位置に関する情報または当該行中の文字フォントに関する情報のどちらか一方を有する行データを求めるステップと、(b) 前記文書の論理構造のキーワードと、当該論理構造を示す属性及びそのレベルと、当該論理構造の妥当性を示すコストとの対応関係を記述した辞書を用いることにより、それぞれの前記行に対して、複数のラベルの付与を許容しつつ、前記属性、前記レベル、及び前記コストからなるラベルを付与するステップと、(c) それぞれの行に与えられた前記ラベルをノードに対応付けると共に、前記行の隣接関係に基づいてそれぞれの前記ノードをリンクした有向グラフを生成するステップと、(d) 前記行データに基づいて前記ラベル中の前記コストを修正することにより、当該ラベルが対応する前記ノードに対してノードコストを与えると共に、前記行データ及び行の前後関係に基づいて、それぞれの前記リンクに対してリンクコストを与えるステップと、(e) 前記有向グラフの起点ノードから終端のノードまで到達する少なくとも1つの経路を、前記ノードコストと前記リンクコストの和に基づき順位付けするステップとを有することを特徴とする文書の論理構造の解析方法。
IPC (3):
G06F 17/27 ,  G06F 17/21 ,  G06K 9/62
FI (3):
G06F 15/20 550 E ,  G06K 9/62 Z 9061-5H ,  G06F 15/20 530 E
Patent cited by the Patent:
Cited by examiner (8)
  • 特開昭62-245367
  • 特開平4-120661
  • OCR入力された日本語文の後処理方法
    Gazette classification:公開公報   Application number:特願平3-257194   Applicant:インターナシヨナル・ビジネス・マシーンズ・コーポレイシヨン
Show all

Return to Previous Page