特許
J-GLOBAL ID:200903087667181295

文字認識装置、その方法および記録媒体

発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願2000-243384
公開番号(公開出願番号):特開2002-056357
出願日: 2000年08月10日
公開日(公表日): 2002年02月20日
要約:
【要約】 (修正有)【課題】 文字認識装置において、文字認識結果を言語解析して認識結果の修正及び認識精度の向上を図る。【解決手段】 入力画像の文字領域から文字行を切出す行切出し部20により切出された文字を切り出す文字切出し部30、文字切出し部からの文字特徴を認識辞書45とから認識候補を得る文字認識部40と、その文字候補を修正する言語解析部50を設ける。その他、行切出し部で切出された行を、本文行、文字修飾行(ルビ、下線、傍点、網掛け等)に分類する行タイプ分類部60、行タイプ分類部による分類タイプが文字装飾であるとき、これを抽出する文字飾飾抽出部70と、この文字装飾に対応する隣接行の文字列を抽出する対応文字抽出部80を設け、言語解析部50は文字認識部からの出力の候補の組み合せに対し単語辞書55を用い形態解析を行い、文字修飾行の情報から形態素の範囲を限定し、文章として可能性なき組合せを排除し照合精度向上を図る。
請求項(抜粋):
入力された画像の文字画像領域から切り出された文字画像に対して文字認識した結果に言語処理を行って認識結果を得る文字認識装置において、入力された画像の文字画像領域から文字列の行を切り出す行切出し部と、前記行切出し部から切り出された行から文字を切り出す文字切出し部と、前記文字切出し部で切り出された文字を認識する文字認識部と、前記文字認識部で認識された文字候補を組み合わせて生成される文字列を言語解析して前記文字認識部の認識文字候補を修正する言語解析部とを備え、前記行切出し部で切り出された行のタイプを分類する行タイプ分類部と、前記行タイプ分類部で分類された行のタイプが文字装飾であるとき、その文字装飾を抽出する文字装飾抽出部と、この文字装飾を含んだ行に隣接した行のこの文字装飾に対応する文字列を抽出する対応文字列抽出部とを設け、前記言語解析部は、言語解析するときに前記対応文字列抽出部で抽出された文字列を1つの単語として解釈して認識候補を修正するようにしたことを特徴とする文字認識装置。
IPC (2件):
G06K 9/72 ,  G06K 9/03
FI (2件):
G06K 9/72 B ,  G06K 9/03 D
Fターム (6件):
5B064AA01 ,  5B064BA01 ,  5B064EA19 ,  5B064EA20 ,  5B064EA23 ,  5B064EA27

前のページに戻る