特許
J-GLOBAL ID:200903012973151545
文字列種別判定方法及び装置
発明者:
出願人/特許権者:
代理人 (1件):
大塚 康徳 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-173795
公開番号(公開出願番号):特開平10-021336
出願日: 1996年07月03日
公開日(公表日): 1998年01月23日
要約:
【要約】【課題】光学的に読取った原稿イメージに含まれる文字列がアルファベット使用言語の文字列か日本語の文字列かを自動的に識別することを可能とする。【解決手段】ビットマップ画像に領域分離を施し、文字領域を分離する(ステップS101)。続いて、分離された文字領域について行の抽出を行う(ステップS104)。次に、抽出された各行について、所定値以上の幅を有するスペースの数をカウントする(ステップS106)。そして、ステップS106でカウントされたスペースの数と、当該抽出された行の幅との比Rを求め、このRの値に基づいて当該行が日本語の行かアルファベット使用言語(ここでは英語)の行かを判定する(ステップS107、S108)。この判定結果に従って、日本語用OCRもしくは英語用OCRのいずれかを用いて当該行の文字認識処理を行う(ステップS109、S110)。
請求項(抜粋):
文字画像から行を抽出する抽出手段と、前記抽出手段によって抽出された行について所定値以上の幅を有するスペースの数をカウントするカウント手段と、前記カウント手段によってカウントされたスペースの数と、当該抽出された行の幅とに基づいて日本語の行かアルファベット使用言語の行かを判定する判定手段とを備えることを特徴とする文字列種別判定装置。
前のページに戻る