OCRを向上させるためのテキスト画質ベースのフィードバック

発明者： , , ,
出願人/特許権者：
代理人 (2件)：村山靖彦 , 黒田晋平
公報種別：特許公報
出願番号（国際出願番号）：特願2015-547384
特許番号：特許第6129987号
出願日： 2013年11月22日
請求項（抜粋）：

【請求項1】同一のテキストの複数の画像を使用することによってテキスト認識を向上させるための方法であって、実世界のシーンの複数の画像を複数のズームレベルでキャプチャするステップであって、前記実世界のシーンが1つまたは複数のサイズのテキストを含むステップと、前記複数の画像の各々から1つまたは複数のテキスト領域を抽出するステップと、前記複数の画像のうちの1つまたは複数から抽出された第1のテキスト領域の1つまたは複数のバージョンにおけるOCRに関連する属性を分析するステップと、前記属性が前記第1のテキスト領域のあるバージョンにおいて光学文字認識(OCR)の限界を超えていない値を有するとき、前記第1のテキスト領域の前記バージョンをOCRへの入力として与えるステップと、前記属性の値がOCRの限界を満たさないとき、前記第1のテキスト領域の前記属性が前記OCRの限界を満たす新たなズームレベルを計算し、前記第1のテキスト領域の少なくとも識別をリストに格納するステップと、前記複数の画像から抽出した他のテキスト領域を提供するステップまたは計算するステップを繰り返すステップと、前記リストを使用して、前記リスト内の全てのテキスト領域をカメラの視野内に保持する最大ズームレベルを特定するステップと、前記最大ズームレベルに基づいて、少なくとも1つの追加の画像をキャプチャするためのフィードバックを生成するステップと、を含む方法。

IPC (1件)：

G06K 9/20 ( 200 6.01)

FI (1件)：

G06K 9/20 320 Z

前のページに戻る