特許
J-GLOBAL ID:200903000012560465

文書検索システムおよび文書検索表示システム

発明者:
出願人/特許権者:
代理人 (1件): 有近 紳志郎
公報種別:公開公報
出願番号(国際出願番号):特願平7-171986
公開番号(公開出願番号):特開平9-022417
出願日: 1995年07月07日
公開日(公表日): 1997年01月21日
要約:
【要約】【目的】 記憶するデータ量が少なくて済み、検索ノイズを低減できる文書検索システムを提供する。【構成】 ユーザが検索キー1を入力する。検索文字列展開部5にて、コンフュージョンマトリクス10を用いて、検索文字列に展開する。テキストサーチ部15にて、テキスト20の中から検索文字列を含む文書を求める。単語サーチ部25にて、単語辞書30の中から検索文字列と部分一致する単語を求める。検索文字列確認部65にて、前記文書中の検索文字列が前記単語の一部か否かを判定する。出力結果処理部55Aにて、ある文書が含む検索文字列が全て前記単語の一部である場合に当該文書を疑似ヒット文書と判定し、そうでない場合に当該文書をヒット文書と判定し、ヒット文書のみを、又は、求めた全ての文書を、又は、ヒット文書と疑似ヒット文書の2種類を区別して全ての文書を、検索結果60として出力する。【効果】 高精度に文書を検索することが出来る。
請求項(抜粋):
文書の画像中の文字を認識して得られた第1位候補文字をテキストとして蓄積するテキスト蓄積手段と、誤認識されやすい文字をグループ化したコンフュージュンマトリクス手段と、そのコンフュージュンマトリクス手段を用いて検索キーを検索文字列に展開する検索文字列展開手段と、前記テキストを検索して前記検索文字列のいずれかを含む文書(以下、サーチ文書という)を求めるテキストサーチ手段とを有する文書検索システムにおいて、単語辞書手段と、その単語辞書手段を検索して前記検索文字列が部分一致する単語(以下、サーチ単語という)を求める単語サーチ手段と、前記テキストサーチ手段で求めた文書に含まれる検索文字列が前記サーチ単語の一部であるか否かを判定する検索文字列確認手段と、ある文書が含む検索文字列が全て前記サーチ単語の一部である場合に当該文書を疑似ヒット文書と判定しそうでない場合に当該文書をヒット文書と判定するサーチ文書判定手段とを具備したことを特徴とする文書検索システム。
FI (2件):
G06F 15/403 350 A ,  G06F 15/40 370 A
引用特許:
出願人引用 (2件) 審査官引用 (1件)

前のページに戻る