特許
J-GLOBAL ID:201103084946103953

帳票検索システム

発明者:
出願人/特許権者:
代理人 (2件): 西山 恵三 ,  内尾 裕一
公報種別:特許公報
出願番号(国際出願番号):特願2001-340606
公開番号(公開出願番号):特開2003-141447
特許番号:特許第4065484号
出願日: 2001年11月06日
公開日(公表日): 2003年05月16日
請求項(抜粋):
【請求項1】 帳票を画像データとして読み取る画像入力手段と、 該画像入力手段で読み取った画像の特微量に基づいて当該画像をテキスト部分とテーブル部分とを含む複数の部分に分割する分割手段と、 該分割手段で分割されたテキスト部分の文字を認識する文字認識手段と、 前記分割手段で分割されたテーブル部分のテーブル構造を識別する識別手段と、 該識別手段で識別されたテーブル構造と、前記文字認識手段により認識された文字とをページレイアウトを示すページデータに対応づけたページ書式データを作成するページ書式データ作成手段と、 該ページ書式データ作成手段によりテンプレート帳票から作成されたページ書式データを保存する保存手段と、 テーブルの個数に対してその個数と一致するテーブルを含むテンプレート帳票を対応づけたテーブル個数インデックスと、 セルの個数に対してその個数と一致するセルを持つテーブルを含むテンプレート帳票を対応づけたセル個数・テンプレート帳票インデックスと、 ページ書式データ間の類似度を計算する類似度計算手段とを備え、 新規に登録帳票のページ書式データを前記保存手段に登録しようとする際に、前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、当該登録帳票とテーブルの個数及び各テーブルのセルの個数が一致するテンプレート帳票を取得する第1の取得手段と、 前記ページ書式データ作成手段により前記登録帳票から作成されたページ書式データと、前記第1の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたページ書式データとの類似度を前記類似度計算手段により計算し、当該類似度により一致する帳票が既に保存されている場合に当該登録帳票の登録を禁止する重複登録防止手段と、 前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、当該登録帳票とテーブルの個数が一致し、各テーブルのセルの個数の差が所定値以内であるテンプレート帳票を取得する第2の取得手段と、 前記第1の取得手段により取得されたテンプレート帳票で、前記類似度計算手段により計算された類似度が閾値以上であるテンプレート帳票を前記登録帳票と対応づけて第1の類似度インデックスに登録し、前記第2の取得手段により取得されたテンプレート帳票で、前記類似度計算手段により計算された類似度が前記閾値以上であるテンプレート帳票を前記登録帳票と対応づけて第2の類似度インデックスに登録する類似度インデックス登録手段と、 前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、検索帳票とテーブルの個数及び各テーブルのセルの個数が一致するテンプレート帳票を取得する第3の取得手段と、 前記ページ書式データ作成手段により前記検索帳票から作成されたページ書式データと、前記第3の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたテンプレート帳票のページ書式データとの類似度を前記類似度計算手段により計算し、類似度が最も高いテンプレート帳票に対応づけて前記第2の類似度インデックスに登録されたテンプレート帳票を取得する第4の取得手段と、 前記第4の取得手段により取得されたテンプレート帳票に対応づけて前記第1の類似度インデックスに登録されたテンプレート帳票を取得する第5の取得手段と、 前記ページ書式データ作成手段により前記検索帳票から作成されたページ書式データと、前記第4または第5の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたテンプレート帳票のページ書式データとの類似度を前記類似度計算手段により計算し、当該計算結果及び前記第4の取得手段における計算結果において類似度が閾値以上となるテンプレート帳票を出力する出力手段と を有することを特徴とする帳票検索システム。
IPC (1件):
G06K 9/20 ( 200 6.01)
FI (1件):
G06K 9/20 340 C
引用特許:
出願人引用 (3件)
  • 光学文字認識装置
    公報種別:公開公報   出願番号:特願平8-304731   出願人:シャープ株式会社
  • 文書画像処理装置
    公報種別:公開公報   出願番号:特願平5-192746   出願人:沖電気工業株式会社
  • 帳票分類方法及び装置
    公報種別:公開公報   出願番号:特願2000-138449   出願人:キヤノン株式会社
審査官引用 (3件)
  • 光学文字認識装置
    公報種別:公開公報   出願番号:特願平8-304731   出願人:シャープ株式会社
  • 文書画像処理装置
    公報種別:公開公報   出願番号:特願平5-192746   出願人:沖電気工業株式会社
  • 帳票分類方法及び装置
    公報種別:公開公報   出願番号:特願2000-138449   出願人:キヤノン株式会社

前のページに戻る