特許
J-GLOBAL ID:200903050810438447

帳票認識システム、帳票認識方法及びコンピュータプログラム

発明者:
出願人/特許権者:
代理人 (2件): 岩田 敏 ,  岩田 享完
公報種別:公開公報
出願番号(国際出願番号):特願2004-322827
公開番号(公開出願番号):特開2006-134106
出願日: 2004年11月05日
公開日(公表日): 2006年05月25日
要約:
【課題】 帳票の記入者が自由に設計した帳票であっても、フォームを使わずに帳票をOCRで認識可能とすること。【解決手段】 予め帳票の論理構造を定義し、入力された入力帳票の値を取得可能としたシステムであり、帳票上の項目名に関連する用語をグルーピングした概念辞書DB、帳票の種類別に帳票の論理構造を定義したスキーマ情報DBを備える。入力帳票の項目名をOCRエンジンで読み取り、各項目名が概念辞書DBに記憶されたグループのうち、どのグループに属しているかを抽出する。抽出したグループと順序をスキーマ情報DBに記憶された複数のスキーマ情報を参照して入力帳票の論理構造を推測し、帳票の候補リストを動的に生成する。生成した候補リストの中から、帳票の値を読み取り、その帳票の値をスキーマ情報の要素名及びデータ型と照合し、帳票結果として出力する。【選択図】 図1
請求項(抜粋):
予め帳票の論理構造を定義し、入力された入力帳票の値を取得可能とした帳票認識システムであって、 帳票上の項目名を、項目名に関連する用語に基づいてグルーピングし、複数のグループを作成した概念辞書を記憶する概念辞書データベースと、 前記項目名が属するグループ及び前記入力帳票の値を、所定の言語を用いて要素名及びデータ型によってそれぞれ関連付けて、帳票の種類別に帳票の論理構造を定義して作成した複数のスキーマ情報を記憶するスキーマ情報データベースと、 前記入力帳票の項目名を読み取り手段を用いて読み取った際に、各項目名が概念辞書データベースに記憶されたグループのうち、どのグループに属しているかを参照して抽出し、当該抽出したグループと順序を前記スキーマ情報データベースに記憶された複数のスキーマ情報を参照して前記入力帳票の論理構造を推測し、少なくとも一つの帳票の候補リストを動的に生成する候補リスト生成手段と、 当該候補リスト生成手段が生成した候補リストの中から、帳票の値を読み取る帳票値読み取り手段と、 読み取った帳票の値を、前記スキーマ情報の要素名及びデータ型と照合して整合性を判別する要素名/データ型判別手段と、 を備えたことを特徴とする帳票認識システム。
IPC (3件):
G06K 9/20 ,  G06Q 10/00 ,  G06K 9/62
FI (4件):
G06K9/20 340Z ,  G06F19/00 300C ,  G06F19/00 300G ,  G06K9/62 610Z
Fターム (11件):
5B029AA01 ,  5B029BB03 ,  5B029CC13 ,  5B029CC18 ,  5B029CC24 ,  5B029CC26 ,  5B064AA01 ,  5B064BA01 ,  5B064EA18 ,  5B064EA19 ,  5B064FA02
引用特許:
出願人引用 (1件)

前のページに戻る