Pat
J-GLOBAL ID:200903053877967451

文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法

Inventor:
Applicant, Patent owner:
Agent (1): 福井 豊明
Gazette classification:公開公報
Application number (International application number):2000053079
Publication number (International publication number):2001034763
Application date: Feb. 29, 2000
Publication date: Feb. 09, 2001
Summary:
【要約】【課題】 文書画像からタイトル領域やユーザが付したマークを抽出して文書タグ情報として利用する。【解決手段】 先ず、タイトル領域抽出手段が所定の抽出判定値より大きい領域平均文字サイズの領域をタイトル領域として抽出する。これにより1つの文書画像から複数のタイトル領域を抽出できる。次に、ユーザが入力画像に付したマークをマーク抽出手段が抽出し、このマークの特徴値を算出手段が算出する。そしてこの特徴値と標準タグ情報の属性値に基づいて、文書タグ情報付与手段が上記入力画像に付与すべき文書タグ情報を、上記標準タグ情報の中から選択する。これにより文書画像に対して文書タグ情報を自動的に付与することが可能となる。
Claim (excerpt):
紙文書を読み取って文書画像を生成する画像入力手段と、該文書画像を複数の領域に分割する領域分割手段と、該領域分割手段によって分割された各領域について文字の平均サイズに相当する領域平均文字サイズを算出した後、該領域平均文字サイズに基づいて全領域の中からタイトル領域を抽出するタイトル領域抽出手段とを備えた文書画像処理装置において、全領域の文字の平均サイズに相当する全平均文字サイズを算出した後、該全平均文字サイズに抽出パラメータを乗算した抽出判定値と上記領域平均文字サイズとを比較し、上記抽出判定値より大きい領域平均文字サイズの領域をタイトル領域として抽出する上記タイトル領域抽出手段を備えたことを特徴とする文書画像処理装置。
IPC (3):
G06T 7/00 ,  G06F 17/30 ,  G06T 1/00
FI (5):
G06F 15/70 330 Q ,  G06F 15/40 370 B ,  G06F 15/401 310 A ,  G06F 15/401 330 Z ,  G06F 15/62 330 A
F-Term (23):
5B050BA10 ,  5B050BA16 ,  5B050DA06 ,  5B050EA01 ,  5B050EA03 ,  5B050EA04 ,  5B050EA07 ,  5B075ND07 ,  5B075NK31 ,  5B075NK39 ,  5B075NR03 ,  5B075NR12 ,  5L096BA17 ,  5L096EA35 ,  5L096EA43 ,  5L096FA44 ,  5L096FA59 ,  5L096FA64 ,  5L096GA15 ,  5L096GA34 ,  5L096HA08 ,  5L096JA03 ,  5L096JA11

Return to Previous Page