特許
J-GLOBAL ID:200903045265983137
文字認識装置
発明者:
出願人/特許権者:
代理人 (1件):
小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-241599
公開番号(公開出願番号):特開平6-096285
出願日: 1992年09月10日
公開日(公表日): 1994年04月08日
要約:
【要約】【目的】 画像データを文字切り出しして文字画像データを得る際に、隣接する二つの半角文字を誤って一つの全角文字として切り出した場合でも、正しい解文字を得ることの出来る、信頼性に優れた文字認識装置の提供。【構成】 画像データを一文字毎の画像データに切り出す文字切り出し部と、画像データを認識しコードに変換する文字認識部と、文字認識部の認識結果に対し言語処理を行う言語処理部と、単語群中より一文字単語であり且つ左右に分離可能な文字からなる単語を被疑単語として抽出する被疑単語抽出部と、被疑単語の画像データを二つの半角文字として切りだす被疑単語再切り出し部と、その画像データを認識しコードに変換する被疑単語文字認識部と、再切り出し後の認識結果に対し言語処理を行う再言語処理部と、言語処理部による認識結果と再言語処理部による認識結果とを比較して最終的な解文字列を決定する判定部と、を備えた文字認識装置。
請求項(抜粋):
画像読み取り部によって読み取られた画像データを一文字毎の文字画像データに切り出す文字切り出し部と、前記文字切り出し部によって切り出された文字画像データを文字認識して文字コードに変換する文字認識部と、前記文字認識部によって認識された文字認識結果に対して言語処理を行い文字単位で区分されている文字認識結果を単語単位の区分に変更する言語処理部と、前記言語処理部で得られた単語群中より一文字単語であり且つ左右に分離可能な文字からなる単語を被疑単語として抽出する被疑単語抽出部と、前記被疑単語抽出部によって抽出された被疑単語は認識対象文書中の隣接する半角文字を一つの全角文字として誤認識した可能性が高いと判断して被疑単語の画像データを二つの半角文字として切りだす被疑単語再切り出し部と、前記被疑単語再切り出し部によって切り出された文字画像データを文字認識して文字コードに変換する被疑単語文字認識部と、前記被疑単語文字認識部による再切り出し後の文字認識結果に対して言語処理を行う再言語処理部と、前記言語処理部による文字認識結果と前記再言語処理部による文字認識結果とを比較して最終的な解文字列を決定する判定部と、からなることを特徴とする文字認識装置。
前のページに戻る