特許
J-GLOBAL ID:200903057091932277

文書検索方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 笹岡 茂 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-326330
公開番号(公開出願番号):特開平7-152774
出願日: 1993年11月30日
公開日(公表日): 1995年06月16日
要約:
【要約】【目的】 文書をOCRにより検索用の文字コード列に変換する文書検索装置において、検索文字列を誤認識し易い文字列へ展開して検索漏れを少なくする。【構成】 文字コード列130には紙の形態の文書をスキャナ120を用いてイメージ入力し、文字を文字認識手段を用いて認識し、その認識出力をそのまま用いてテキストコードに変換し、登録した文字コード列であり、画像データ140は上記のイメージデータである。文字展開用ルールベース150には文字認識手段が誤認識し易い文字について複数の候補をあげた類似文字列リストが登録されている。検索時には、検索文字列展開プログラムにより検索条件式の検索文字列を類似文字列リストを用いて展開して展開文字列を生成し、該展開文字列のいずれかの文字列を含む文書を文字列検索プログラムにより検索する。
請求項(抜粋):
紙の形態の文書をイメージデータとして取り込むためのスキャナと、検索結果を表示するディスプレイと、検索条件式を入力するキーボードと、文書をテキストコードの状態で蓄積する蓄積手段と、蓄積したテキストコードを読出して検索条件式として指示された文字列が存在する文書を検索する検索手段と、文書を登録する際に紙の形態の文書を該スキャナを用いてイメージ入力し文字認識手段を用いてテキストコードに変換して前記蓄積手段に登録する手段を持つ文書検索装置における文書検索方法であって、前記蓄積手段への文書のテキストコード登録時には前記文字認識手段が認識出力した文字をそのまま登録し、検索時には、検索条件式の検索文字列を文字認識手段が誤認識しやすい文字について複数の候補をあげた類似文字列リストにより展開して展開文字列を生成し、該展開文字列のいずれかの文字列を含む文書を検索することを特徴とする文書検索方法。

前のページに戻る