特許
J-GLOBAL ID:200903053673035460

日本語文書読み取り装置

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦
公報種別:公開公報
出願番号(国際出願番号):特願平3-286838
公開番号(公開出願番号):特開平5-128303
出願日: 1991年10月31日
公開日(公表日): 1993年05月25日
要約:
【要約】【目的】本発明は、日本語文書中に混在する英語を抽出し、英語接触文字が含まれても各文字に分割して適切な文字認識を行うようにしている。【構成】画像入力部2により原稿1より読み取られた文書画像を文字行切出し部3に与え文字行を切り出し、これを文字切出し部4に与え文書中の認識対象文字列について認識結果の類似度、対象文字列の前後の文字種、対象文字列の前後文字の認識結果の類似度、対象文字の複雑さなどの情報を総合的に用いて対象文字列が日本語であるか英語であるかを判定し、この判定により英語と判定した文字列について妥当な分割位置を決定し、この分割された文字を英語として文字認識部5で文字認識を行ない、この結果を出力部6より出力するように構成している。
請求項(抜粋):
日本語文中に英語が混在する文書の文字認識を行う日本語文書読み取り装置において、前記文書中の認識対象文字列について該対象文字列の認識結果の類似度、対象文字列の前後の文字種、対象文字列の前後文字の認識結果の類似度、対象文字の複雑さの少なくとも1の結論に基づいて該対象文字列が日本語であるか英語であるかを判定する判定手段と、この判定手段により英語と判定した文字列について妥当な分割位置を決定する手段と、この手段により分割された文字を英語として文字認識を行う手段とを具備したことを特徴とする日本語文書読み取り装置。
引用特許:
審査官引用 (4件)
  • 特開平2-239386
  • 特開昭61-046573
  • 特開平2-090384
全件表示

前のページに戻る