特許
J-GLOBAL ID:200903005524073070

文書認識装置および言語処理装置

発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願平8-353230
公開番号(公開出願番号):特開平10-177623
出願日: 1996年12月16日
公開日(公表日): 1998年06月30日
要約:
【要約】【課題】 自動的に対象言語に適した文字認識手段を選択して文字認識を行うことができ、また、そのために処理時間が長くならないで済む文書認識装置などを提供する。【解決手段】 複数の言語に対応した言語L1辞書1及び言語L2辞書2と、両辞書1、2のそれぞれに含まれている認識対象文字からそれぞれの言語を特徴付ける文字として予め抽出された識別文字の特徴情報をそれぞれの言語毎に保持する認識文字辞書3と、文書から読み取られた画像データに対して認識文字辞書3のそれぞれの言語の辞書を用いて順次文字認識処理を行い、その文字認識結果に基づいて全体の文字数に対する認識された識別文字の割合を示す識別文字出現率を認識文字辞書3のそれぞれの言語の辞書に対して求め、最も高い識別文字出現率を示した文字認識用辞書に対応した言語を識別する言語識別手段5と、言語識別手段5により識別された言語に対応した言語L1辞書1又は言語L2辞書2を用いて画像データに対し文字認識を行う言語L1文字認識手段6及び言語L2文字認識手段7とを備えた。
請求項(抜粋):
画像データからなる文字を認識する文字認識手段を備えた文書認識装置において、複数の言語に対応した複数の第1の文字認識用辞書と、上記第1の文字認識用辞書のそれぞれに含まれている認識対象文字からそれぞれの言語を特徴付ける文字として予め抽出された識別文字の特徴情報を上記それぞれの言語毎に保持する第2の文字認識用辞書と、文書から読み取られた画像データを保持する画像データ保持手段と、上記画像データに対して上記第2の文字認識用辞書のそれぞれの言語の辞書を用いて順次文字認識処理を行う識別文字認識手段と、上記識別文字認識手段による文字認識結果を保持する識別文字認識結果保持手段と、上記識別文字認識手段による文字認識が終了した後に、上記識別文字認識結果保持手段に保持された文字認識結果に基づいて全体の文字数に対する認識された識別文字の割合を示す識別文字出現率を第2の文字認識用辞書のそれぞれの言語の辞書に対して求め、最も高い識別文字出現率を示した文字認識用辞書に対応した言語を識別する言語識別手段と、上記言語識別手段により識別された言語に対応した第1の文字認識用辞書を用いて上記画像データに対し文字認識を行う文字認識手段とを備えたことを特徴とする文書認識装置。
IPC (2件):
G06K 9/62 610 ,  G06K 9/68
FI (2件):
G06K 9/62 610 D ,  G06K 9/68 B
引用特許:
審査官引用 (5件)
全件表示

前のページに戻る