特許
J-GLOBAL ID:200903083158989296

文書画像のタイトル抽出方法、抽出プログラム、及びタイトル抽出装置

発明者:
出願人/特許権者:
代理人 (1件): 根本 恵司
公報種別:公開公報
出願番号(国際出願番号):特願2001-247390
公開番号(公開出願番号):特開2003-058556
出願日: 2001年08月16日
公開日(公表日): 2003年02月28日
要約:
【要約】【課題】 処理速度が速く抽出精度が高い文書画像のタイトル抽出方法、抽出プログラム等を提供する。【解決手段】 文書画像から行領域からなる文字領域にポイント付けをしてタイトルを抽出する文書画像のタイトルの抽出において、行領域の抽出に先だって文書画像から部分領域を選出し(S102)、その部分領域について文字認識を行い(S103)、その文字列をタイトルとするか否かの判定を行う(S104)。その判定結果が否定的なときには(S105,NG)、行領域の抽出後、文字領域にポイント付けをしてタイトルを抽出するが(S106)、判定結果が肯定的なときには(S105,OK)、行領域の抽出や、文字領域全体についての処理を行わないですませる。
請求項(抜粋):
文書画像から行領域からなる文字領域にポイント付けをしてタイトルを抽出する文書画像のタイトル抽出方法において、前記行領域の抽出に先だって前記文書画像から部分領域を選出する工程と、その部分領域について文字認識を行う工程と、文字列を認識できたときそれをタイトルとするか否かの判定を認識結果と位置情報とに基づいて行う工程と、その判定結果が否定的なときには前記行領域の抽出後に前記文字領域にポイント付けをしてタイトルを抽出する工程とからなることを特徴とする文書画像のタイトル抽出方法。
IPC (5件):
G06F 17/30 210 ,  G06F 17/30 170 ,  G06K 9/00 ,  G06K 9/20 340 ,  G06T 7/40 100
FI (5件):
G06F 17/30 210 A ,  G06F 17/30 170 B ,  G06K 9/00 L ,  G06K 9/20 340 J ,  G06T 7/40 100 B
Fターム (11件):
5B029AA01 ,  5B029BB02 ,  5B029CC27 ,  5B029EE12 ,  5B064CA08 ,  5B075ND07 ,  5B075NK37 ,  5B075NK39 ,  5L096BA17 ,  5L096FA44 ,  5L096JA11
引用特許:
審査官引用 (6件)
全件表示

前のページに戻る