特許
J-GLOBAL ID:200903018297571089

グラフをベースとしたテーブル認識方法

発明者:
出願人/特許権者:
代理人 (1件): 中村 稔 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-000874
公開番号(公開出願番号):特開平9-198456
出願日: 1997年01月07日
公開日(公表日): 1997年07月31日
要約:
【要約】【課題】 データイメージデータとして表されたドキュメントの中に存在するテーブルを認識する方法を提供する。【解決手段】 本方法は、1)データイメージデータをセグメント化し、ドキュメント内のテキスト・エンティティとイメージ・エンティティを識別すること、2)前記エンティティを使用してドキュメントのレイアウトグラフを作成すること、3)続いて、各テキスト・エンティティにドキュメントノードのアルファベットからのラベルをもつタグを付け、ラベル付きグラフを生成すること、4)および少なくとも1つの再書き込み規則を使用してラベル付きグラフのテキスト・エンティティを処理し、ドキュメント構造を識別すること、から成る。
請求項(抜粋):
グラフをベースとして、ディジタル・イメージデータとして表されたドキュメント中に存在するテーブルを認識する方法であって、ドキュメント内のテキスト・エンティティとイメージ・エンティティを識別するように、ディジタル・イメージデータをセグメント化し、前記エンティティを用いて前記ドキュメントのレイアウトグラフを構築し、続いて、ラベル付きグラフを生成するように、各テキスト・エンティティに、ドキュメントノードのアルファベットからのラベルをもちいてタグを付け、前記ドキュメントの構造を識別するように、少なくとも1つの再書き込み規則を使用して、前記ラベル付きグラフのテキスト・エンティティを操作する諸ステップから成ることを特徴とする方法。
IPC (3件):
G06F 19/00 ,  G06F 17/21 ,  G06T 11/60
FI (5件):
G06F 15/22 C ,  G06F 15/20 547 E ,  G06F 15/22 G ,  G06F 15/22 310 D ,  G06F 15/62 325 P

前のページに戻る