特許
J-GLOBAL ID:200903064821945279

文字認識方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 中島 司朗
公報種別:公開公報
出願番号(国際出願番号):特願平6-325271
公開番号(公開出願番号):特開平8-185485
出願日: 1994年12月27日
公開日(公表日): 1996年07月16日
要約:
【要約】【目的】 文字間隔長及び単語間隔長が狭い文字列についても精度良好、項目分類の自動修正が可能、キーワード辞書に登録されていない項目についても文字種判定可能、しかも該辞書と単語辞書の容量削減が図れ、文字切り出しミスや単語検出ミスを許容して文字、単語を認識する技術を提供する。【構成】 文字切り出しステップS1で、文書画像から認識対象文字の位置を基に文字画像を切り出す。文字認識ステップS2で、文字画像を認識辞書と照合し、認識候補文字を得る。単語検出ステップS3で、文字画像の位置等から単語を検出する。項目分類ステップS4で、単語をキーワード辞書と照合し、項目に分類する。単語修正ステップS5で、分類した単語を、対応する項目別単語辞書と照合し、文字等の認識結果に誤りがあれば修正する。
請求項(抜粋):
文書画像から認識対象文字の位置を検出して文字画像を切り出す文字切り出しステップと、前記文字切り出しステップで切り出した文字画像を認識辞書と照合する、決定木法による等して候補文字を抽出する文字認識ステップと、前記文字切り出しステップで切り出した同一文字列内の認識対象文字の位置を基に相隣合う認識対象文字の間隔長のヒストグラムを作成するヒストグラム作成ステップと、前記ヒストグラム作成ステップにて作成したヒストグラムにおける文字間隔長の小さい値からの第1ピークが終了する文字間隔長を見出す第1ピーク終了位置発見ステップと、前記第1ピーク終了位置発見ステップにて発見した文字間隔長を単語区切りと見なす閾値として採用し、この上で前記文字認識ステップの結果と併せて単語を検出する単語検出ステップと、前記単語検出ステップで検出した単語を、単語辞書及び単語を意味内容の面から特定するのに役立つそして単語を構成する図形としての文字列から得られる情報である文字列ルールの少なくも一と照合して必要な修正を施す単語修正ステップとを有することを特徴とする文字認識方法。
引用特許:
審査官引用 (14件)
  • 文字認識装置
    公報種別:公開公報   出願番号:特願平3-201520   出願人:日本電気ホームエレクトロニクス株式会社
  • 特開平2-056086
  • 特開平3-142694
全件表示

前のページに戻る