特許
J-GLOBAL ID:200903015518573996

文書属性取得方法および装置並びにプログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 田中 清 ,  村山 みどり
公報種別:公開公報
出願番号(国際出願番号):特願2004-276374
公開番号(公開出願番号):特開2006-092226
出願日: 2004年09月24日
公開日(公表日): 2006年04月06日
要約:
【課題】 高品質な文書構造化を可能とする文書属性取得方法および装置並びに文書属性取得のためのプログラムを記録した記録媒体を提供する。【解決手段】 本文書属性取得方法は、属性の種類を格納した属性種類部と属性実体の種類を格納した属性実体種類部とを有する複数の属性辞書1〜4を用意する。文書情報より得られた複数のテキスト領域または入力画像から文字認識により得られた複数のテキスト領域6を入力し、各テキスト領域6の内容と複数の属性辞書の属性種類部の内容および属性実体種類部の内容とをそれぞれ照合する。属性種類部の照合結果と前記属性実体種類部の照合結果が合致する属性辞書を選出し、この選出した属性辞書の属性種類部と属性実体種類部から当該テキスト領域の属性および属性実体を取得する。【選択図】 図1
請求項(抜粋):
属性の種類を格納した属性種類部と属性実体の種類を格納した属性実体種類部とを有する複数の属性辞書を用意し、 文書情報より得られた複数のテキスト領域または入力画像から文字認識により得られた複数のテキスト領域を入力し、 前記各テキスト領域の内容と前記複数の属性辞書の属性種類部の内容とを照合し、 前記各テキスト領域の内容と前記複数の属性辞書の属性実体種類部の内容とを照合し、 前記属性種類部の照合結果と前記属性実体種類部の照合結果が合致する属性辞書を選出し、 前記選出した属性辞書の属性種類部と属性実体種類部から前記テキスト領域の属性および属性実体を取得することを特徴とする文書属性取得方法。
IPC (2件):
G06F 17/30 ,  G06K 9/00
FI (4件):
G06F17/30 210Z ,  G06F17/30 170B ,  G06F17/30 310C ,  G06K9/00 S
Fターム (7件):
5B064AA01 ,  5B064AA07 ,  5B064BA01 ,  5B075ND07 ,  5B075NK46 ,  5B075PP04 ,  5B075PP10
引用特許:
出願人引用 (5件)
全件表示
審査官引用 (3件)
引用文献:
出願人引用 (1件)
  • 文書構造と単語属性に基づく再認識処理による名刺OCRソフトウェア
審査官引用 (1件)
  • 文書構造と単語属性に基づく再認識処理による名刺OCRソフトウェア

前のページに戻る