特許
J-GLOBAL ID:200903013850584532

文字認識装置

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-309012
公開番号(公開出願番号):特開平7-160810
出願日: 1993年12月09日
公開日(公表日): 1995年06月23日
要約:
【要約】【目的】 スキャナから取り込んだ二値データから文字領域を抽出し、段組された文書であっても正確に文字の認識を行う。【構成】 二値化された文字認識対象文書に対して、二値画像データから黒画素が連結している箇所を検出し、外接矩形情報として格納する手段と、外接矩形の大きさと縦横比に基づいて二値画素データから文字候補矩形を抽出する手段と、文字候補矩形の配置から文字組方向と行間を検出する手段と、検出した文字組方向に隣り合う文字候補の矩形間距離から認識対象文書の段組情報を検出する手段と、検出した行間と段組情報を基に同一段組中の文字候補矩形を統合して行として認識する手段と、認識された行中から文字領域を抽出する手段とを備え、抽出された文字領域毎に文字認識する手段を備える。
請求項(抜粋):
二値化された文字認識対象文書に対して、二値画像データから黒画素が連結している箇所を検出し、外接矩形情報として格納する手段と、外接矩形の大きさと縦横比に基づいて前記二値画像データから文字候補矩形を抽出する手段と、前記文字候補矩形の配置から文字組方向と行間を検出する手段と、前記検出した文字組方向に隣り合う文字候補の矩形間距離から認識対象文書の段組情報を検出する手段と、前記検出した行間と段組情報を基に同一段組中の前記文字候補矩形を統合して行として認識する手段と、前記認識された行中から文字領域を抽出する手段とを備え、前記抽出された文字領域毎に文字認識する手段を備えることを特徴とする文字認識装置。

前のページに戻る