特許
J-GLOBAL ID:201403023712180272

文書内の文字の局所的な拡大縮小、回転および表示位置に対して不変である光学的文字認識のためのワード検出

発明者:
出願人/特許権者:
代理人 (2件): 伊東 忠重 ,  伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2013-265073
公開番号(公開出願番号):特開2014-132453
出願日: 2013年12月24日
公開日(公表日): 2014年07月17日
要約:
【課題】画像内において多種多様な印字方向を向いているワードを正しく識別することが可能な方法とこの方法を使用して実装されるテキスト抽出アプリケーションを実現する。【解決手段】テキスト抽出アプリケーション103は、入力された画像を段階的にブラー化処理した画像を生成してその画像内における複数の斑点状部分を検出し、複数の斑点状部分を囲む複数の楕円状輪郭線を出力し、複数の楕円状輪郭線に基づいて入力された画像内に含まれるワードを検出し、ワードに対する正規化処理でワードの第1のバージョンを生成し、ワードに対する正規化処理でワードを反転させたバージョンをされに生成し、ワードに関する第1のバージョンと反転させたバージョンに対してOCR処理を実行し、第1のバージョンと反転させたバージョンのそれぞれの信頼度指数を算出し、ワードと関連するテキスト内容を出力する。【選択図】図2
請求項(抜粋):
コンピュータによって実施される方法であって: 入力された画像を受信するステップと、 前記入力された画像を段階的にブラー化処理した画像を生成するステップと、 前記ブラー化処理した画像内における複数の斑点状部分を検出するステップと、 前記複数の斑点状部分をそれぞれ囲んでいる複数の楕円状輪郭線を出力するステップと、 一つ以上のコンピュータ装置を使用して、前記複数の楕円状輪郭線に基づいて前記入力された画像内に含まれるワードを検出するステップと、 前記一つ以上のコンピュータ装置を使用して、前記ワードの印字方向を判定し、前記ワードを正規化するステップと、 前記ワードに対して光学文字認識処理を実行するステップと、 前記一つ以上のコンピュータ装置を使用して、前記ワードと関連するテキスト内容を出力するステップと、 を具備する方法。
IPC (2件):
G06K 9/32 ,  G06K 9/20
FI (2件):
G06K9/32 ,  G06K9/20 340J
Fターム (7件):
5B029AA01 ,  5B029BB02 ,  5B029CC27 ,  5B029CC28 ,  5B029EE04 ,  5B029EE08 ,  5B029EE15

前のページに戻る