特許
J-GLOBAL ID:200903048487967813

文書読取装置

発明者:
出願人/特許権者:
代理人 (1件): 柿本 恭成
公報種別:公開公報
出願番号(国際出願番号):特願平10-196001
公開番号(公開出願番号):特開2000-029983
出願日: 1998年07月10日
公開日(公表日): 2000年01月28日
要約:
【要約】【課題】 1つの文字枠の中に複数の項目名やデータが記載された非定型帳票を確実に読み取ることができる文書読取装置を提供する。【解決手段】 画像読取部21で読み取られた帳票の画像データは、画像メモリ22に格納された後、罫線抽出部23に読み出されて罫線が抽出され、更に文字枠抽出部24で複数の文字枠が抽出される。文字枠中の文字列等の画像データは文字認識部25で認識され、項目枠検出部27において項目名辞書29に基づいて項目名が記載された項目記載枠が検出される。また、データ枠検出部において項目記載枠と同じ並びのデータ記載枠が検出される。データ識別部30において、項目記載枠とデータ記載枠の対応付けが行われ、双方に複数行または区切り符号で区切られた複数の文字列等がある場合には、その区切られた順番に項目名とデータとが対応付けられて識別される。
請求項(抜粋):
罫線で区切られた複数の文字枠を有する文書の画像データを、画素に分解して読み取る画像読取手段と、前記画像読取手段で読み取られた画像データから、縦方向及び横方向の罫線を抽出する罫線抽出手段と、前記罫線抽出手段で抽出された縦方向及び横方向の罫線で囲まれた文字枠を抽出する文字枠抽出手段と、前記文字枠抽出手段で抽出された文字枠の中に記載された文字または文字列を認識して文字コードに変換する文字認識手段と、読み取り対象となる項目の名称が項目名として登録された項目名辞書を参照して、前記文字認識手段で認識された前記文字枠中の文字または文字列が該項目名辞書に登録されている項目記載枠を検出する項目枠検出手段と、前記項目枠検出手段で検出された項目記載枠と同じ並びの右側または下側の文字枠で、前記項目名辞書に登録されていない文字または文字列のデータが記載されたデータ記載枠を検出するデータ枠検出手段と、前記項目枠検出手段で検出された項目記載枠と前記データ枠検出手段で検出されたデータ記載枠とを対応付けるとともに、該項目記載枠中に複数の項目名が記載され、かつ該データ記載枠中に複数のデータが記載されている場合には、その記載された順番に従って該項目名と該データとを対応付けて識別するデータ識別手段とを、備えたことを特徴とする文書読取装置。
Fターム (3件):
5B029CC13 ,  5B029CC26 ,  5B029CC27

前のページに戻る