Pat
J-GLOBAL ID:200903077758749906

文書検索装置および記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 山本 秀策
Gazette classification:公開公報
Application number (International application number):2000254697
Publication number (International publication number):2001134617
Application date: Aug. 24, 2000
Publication date: May. 18, 2001
Summary:
【要約】【課題】 検索にかかるコストが低くて済み、文字認識の誤りに起因する検索漏れを減らすことのできる文書検索装置を提供する。【解決手段】 文書検索装置451は、文字コードの比較により、キーワードの少なくとも一部が認識結果の少なくとも一部に一致するか否かを判定する第1判定手段401と、キーワードの一部が認識結果の少なくとも一部に一致する場合には、キーワードに含まれる少なくとも1つの第1文字のうち認識結果に一致しない第1文字を第1不一致文字として特定する第1不一致文字特定手段402と、認識結果に含まれる少なくとも1つの第2文字のうち、第1不一致文字の幅に最も近い幅を有する1または2以上の連続した第2文字を第2不一致文字として特定する第2不一致文字特定手段402と、第1不一致文字の画像の特徴量と第2不一致文字に含まれる1または2以上の連続した第2文字に割り当てられた1または2以上の部分領域を含む領域の画像の特徴量とを比較することにより、第1不一致文字が第2不一致文字に一致するか否かを判定する第2判定手段402とを備えている。
Claim (excerpt):
文書の画像に対して文字認識を行うことによって得られる認識結果からキーワードを検索する文書検索装置であって、前記キーワードは、少なくとも1つの第1文字を含んでおり、前記少なくとも1つの第1文字のそれぞれには文字コードが割り当てられており、前記認識結果は、少なくとも1つの第2文字を含んでおり、前記少なくとも1つの第2文字のそれぞれには文字コードと、前記文書の画像の部分領域とが割り当てられており、前記文書検索装置は、前記文字コードの比較に基づいて、前記キーワードに一致する少なくとも1つの第1一致部分が前記認識結果に存在するか否かを判定し、存在する場合には、前記少なくとも1つの第1一致部分を特定する第1一致部分特定手段と、所定の第1条件を満たす少なくとも1つの第1部分が前記認識結果から前記特定された少なくとも1つの第1一致部分を除いた部分に存在するか否かを判定し、存在する場合には、前記少なくとも1つの第1部分を特定する第1部分特定手段と、前記第1部分に含まれる前記第2文字に割り当てられた前記部分領域の画像の特徴量と、前記キーワードに含まれる前記第1文字の画像の特徴量との比較に基づいて、前記キーワードに一致する少なくとも1つの第2一致部分が前記特定された少なくとも1つの第1部分に存在するか否かを判定し、存在する場合には、前記少なくとも1つの第2一致部分を特定する第2一致部分特定手段とを備え、前記所定の第1条件は、前記第1部分が、幅が予め定められた値よりも小さい特定の第2文字の近傍にあるという条件を含む、文書検索装置。
IPC (6):
G06F 17/30 310 ,  G06F 17/30 170 ,  G06F 17/30 210 ,  G06F 17/30 350 ,  G06K 9/00 ,  G06K 9/62 620
FI (6):
G06F 17/30 310 C ,  G06F 17/30 170 B ,  G06F 17/30 210 A ,  G06F 17/30 350 C ,  G06K 9/00 S ,  G06K 9/62 620 D
Patent cited by the Patent:
Cited by examiner (1)

Return to Previous Page