特許
J-GLOBAL ID:201103009329805051

全文検索装置及び全文検索方法

発明者:
出願人/特許権者:
代理人 (2件): 田澤 博昭 ,  加藤 公延
公報種別:特許公報
出願番号(国際出願番号):特願平11-354777
公開番号(公開出願番号):特開2001-175661
特許番号:特許第3803219号
出願日: 1999年12月14日
公開日(公表日): 2001年06月29日
請求項(抜粋):
【請求項1】 入力画像に含まれる各文字画像を識別して、各文字画像に対する1以上の認識候補文字を出力するとともに、各認識候補文字の確度を出力する文字認識手段と、上記文字認識手段が出力する各認識候補文字と文書の対応関係を示すインデックスを作成するインデックス作成手段と、上記入力画像に含まれる各文字画像の中で、基準確度を超える確度の認識候補文字を有しない文字画像が存在する場合、その文字画像の形状特徴を抽出する特徴抽出手段と、文書の検索条件としてキーワードを入力する入力手段と、上記インデックスを参照して、そのキーワードと一致する認識候補文字の文書を検索する一方、そのキーワードと一致する認識候補文字が存在しない場合、上記特徴抽出手段により抽出された文字画像の形状特徴と当該キーワードを構成する文字の形状特徴を照合して、検索条件に合致する文書を検索する検索手段とを備えた全文検索装置において、連接文字を構成している各認識候補文字が、当該文字画像に対する唯一の認識候補文字である場合、その連接文字の出現回数をカウントアップして、その連接文字が文書全体に出現する出現確率を更新する出現確率更新手段を設け、上記インデックス作成手段が当該連接文字をインデックスの作成対象に含める場合には、上記出現確率更新手段により更新された出現確率を考慮して、当該連接文字をインデックスの作成対象に含めるか否かを判定することを特徴とする全文検索装置。
IPC (1件):
G06F 17/30 ( 200 6.01)
FI (2件):
G06F 17/30 310 C ,  G06F 17/30 170 B
引用特許:
出願人引用 (3件) 審査官引用 (3件)

前のページに戻る