Pat
J-GLOBAL ID:200903000604682180

タイトル抽出方法、タイトル抽出装置、タイトル抽出用プログラム、及び該プログラムを記録した記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 根本 恵司
Gazette classification:公開公報
Application number (International application number):2002199100
Publication number (International publication number):2004046295
Application date: Jul. 08, 2002
Publication date: Feb. 12, 2004
Summary:
【課題】文書画像からのタイトル抽出を精度を維持しつつ高速で行う。【解決手段】文書画像から文字領域を抽出し、さらにその文字領域から行情報を抽出し、その行情報からタイトルらしさの情報を抽出してタイトル候補を求めるため、文字領域から行情報を抽出する際に、タイトルとの関係が深い行に絞り込む。つまり、例えば、1領域からは先頭から遠い行にはタイトルは含まれないと仮定してこれを除き、全行数より少ない特定の行数だけを抽出し、該抽出した行のみを次の処理(2次抽出処理)に渡すようにする。【選択図】 図6
Claim (excerpt):
文書画像から文字領域を抽出し、さらにその文字領域から行情報を抽出し、その行情報からタイトルらしさの情報を抽出してタイトル候補を求める各工程からなるタイトル抽出方法において、 文字領域から行情報を抽出する際に、1領域からはタイトルの存在が予想できる1行以上で先頭から全行数未満の特定の行数だけを抽出する工程を有し、該抽出した行情報のみを次の処理に渡すことを特徴とするタイトル抽出方法。
IPC (2):
G06T7/40 ,  G06F17/30
FI (3):
G06T7/40 100B ,  G06F17/30 170B ,  G06F17/30 210A
F-Term (13):
5B075ND06 ,  5B075NK32 ,  5B075PP04 ,  5L096BA17 ,  5L096EA27 ,  5L096EA35 ,  5L096FA18 ,  5L096FA32 ,  5L096FA44 ,  5L096FA64 ,  5L096FA66 ,  5L096FA67 ,  5L096FA69
Patent cited by the Patent:
Cited by examiner (4)
Show all

Return to Previous Page