Pat
J-GLOBAL ID:200903047344230864

文書画像の構造化方法

Inventor:
Applicant, Patent owner:
Agent (1): 鈴木 誠 (外1名)
Gazette classification:公開公報
Application number (International application number):1996134918
Publication number (International publication number):1997319747
Application date: May. 29, 1996
Publication date: Dec. 12, 1997
Summary:
【要約】【課題】 文書毎の特別なモデルを必要とせずに、要素間の相対的なレイアウト差異情報を活用して文書情報の構造化を可能とする。【解決手段】 領域分割手段102によって文書画像が文字領域に分割され、行抽出手段103によって各文字領域から行が抽出される。主要レイアウト特徴判別手段104は、領域分割、行抽出された文書画像から主要レイアウト特徴(文字サイズ、段組の種類など)を判別する。構造化表現手段106は抽出した主要レイアウト特徴と文字認識結果とを合わせて構造的に表現する。
Claim (excerpt):
文書画像を、文字領域を含む複数の要素に分割し、該文字領域から行を生成した後に、前記文書画像からレイアウト情報を抽出し、該レイアウト情報と前記各行の文字認識結果とを合わせて構造的に表現することを特徴とする文書画像の構造化方法。
IPC (2):
G06F 17/27 ,  G06F 17/21
FI (2):
G06F 15/20 550 F ,  G06F 15/20 570 R

Return to Previous Page