特許
J-GLOBAL ID:201203073425223494

文字領域検出装置およびそのプログラム

発明者:
出願人/特許権者:
代理人 (2件): 磯野 道造 ,  多田 悦夫
公報種別:公開公報
出願番号(国際出願番号):特願2010-256468
公開番号(公開出願番号):特開2012-108689
出願日: 2010年11月17日
公開日(公表日): 2012年06月07日
要約:
【課題】本発明は、1枚の画像から精度よく文字領域を検出できる文字領域検出装置を提供する。【解決手段】映像字幕検出装置1は、映像に含まれる字幕領域をその映像から検出するものであり、映像を構成するフレーム画像を出力する映像復号手段10と、フレーム画像を解像度が低い低解像度画像に変換する解像度変換手段20と、記憶手段30と、フレーム画像および低解像度画像に対して字幕検出領域検出処理を施すことで、字幕検出領域を検出する字幕検出手段40と、フレーム画像および低解像度画像から判定された字幕検出領域を統合し、字幕検出を検出結果として出力する検出結果統合手段50とを備える。【選択図】図1
請求項(抜粋):
入力画像に含まれる文字の領域である文字領域を、当該入力画像から検出する文字領域検出装置であって、 前記入力画像が入力されると共に、当該入力画像を、当該入力画像より解像度が低い1以上の低解像度画像に変換する解像度変換手段と、 前記解像度変換手段によって変換された低解像度画像および前記入力画像をそれぞれ、同じ大きさの走査窓で走査することによって、前記入力画像および前記低解像度画像ごとに、前記走査窓の領域に対応した走査窓領域画像を生成する走査手段と、 前記入力画像および前記低解像度画像ごとに、前記走査手段によって生成された走査窓領域画像の特徴ベクトルを算出する画像特徴ベクトル算出手段と、 前記入力画像および前記低解像度画像ごとに、前記画像特徴ベクトル算出手段によって算出された走査窓領域画像の特徴ベクトルに基づいて、当該走査窓領域画像が文字候補領域であるか否かを機械学習によって判定する文字候補領域判定手段と、 前記入力画像および前記低解像度画像ごとに、前記文字候補領域判定手段によって判定された文字候補領域が互いに重なる回数を算出し、算出した当該重なる回数が予め設定された第1閾値以上となる文字候補領域を文字検出領域として判定する文字検出領域判定手段と、 前記文字検出領域判定手段によって判定された低解像度画像ごとの文字検出領域を、当該文字検出領域に対応する低解像度画像が前記入力画像と同じ解像度になる拡大率で拡大する拡大手段と、 前記拡大手段によって拡大された低解像度画像ごとの文字検出領域と、前記入力画像の文字検出領域との何れか1以上が重なるか否かを判定し、互いに重なると判定された文字検出領域のうち、前記入力画像または前記解像度が最大の低解像度画像に対応する文字検出領域である基準文字検出領域に対して、他の文字検出領域が重なる割合を算出すると共に、算出した当該重なる割合が予め設定された第2閾値以上の場合、前記基準文字検出領域のみを前記文字領域として出力する文字領域出力手段と、 を備えることを特徴とする文字領域検出装置。
IPC (2件):
G06T 7/40 ,  G06T 7/00
FI (3件):
G06T7/40 100A ,  G06T7/00 350B ,  G06T7/00 300B
Fターム (16件):
5L096AA06 ,  5L096CA18 ,  5L096EA03 ,  5L096FA06 ,  5L096FA35 ,  5L096FA44 ,  5L096FA52 ,  5L096FA55 ,  5L096FA59 ,  5L096FA69 ,  5L096FA77 ,  5L096GA17 ,  5L096GA51 ,  5L096JA11 ,  5L096JA13 ,  5L096KA04
引用特許:
出願人引用 (2件)

前のページに戻る