特許
J-GLOBAL ID:200903038900416949

文書検索装置

発明者:
出願人/特許権者:
代理人 (6件): 曾我 道治 ,  古川 秀利 ,  鈴木 憲七 ,  梶並 順 ,  大宅 一宏 ,  上田 俊一
公報種別:公開公報
出願番号(国際出願番号):特願2007-180727
公開番号(公開出願番号):特開2009-020567
出願日: 2007年07月10日
公開日(公表日): 2009年01月29日
要約:
【課題】全文検索の文書検索装置で、登録時に検索索引を作成、検索時は文書データ走査をせず索引から検索するNグラム方式は、文字認識誤りを許容する検索の場合、候補文字の組合せ数索引が必要でN値で増加で、索引サイズが増大する。また、キーワードの照合では誤認識候補文字の組合せとが成立し、キーワードとマッチしない箇所が抽出される。【解決手段】文書画像の文字認識をし、その結果の第1位の認識候補文字で構成する第1の検索索引と、第2位以降の認識候補文字で構成する第2の検索索引を作成する索引作成手段と、検索キーワードが入力されるキーワード入力手段と、キーワードが構成される文字列と第1の検索索引および第2の検索索引を照合して照合度合いのスコアを算出する検索スコア算出手段と、検索スコア算出手段から得られた検索スコアをもとに検索結果を出力する出力手段を備える。【選択図】図1
請求項(抜粋):
文書画像中の文字を認識した結果を用いて該文書画像を検索する文書検索装置であって、前記文書画像の文字認識をし、その結果の第1位の認識候補文字で構成される第1の検索索引と、文字認識結果の第2位以降の認識候補文字で構成される第2の検索索引を作成する索引作成手段と、検索するキーワードを入力するキーワード入力手段と、キーワード入力手段で入力されたキーワードが構成される文字列と前記第1の検索索引および前記第2の検索索引を照合して照合の度合いを示すスコアを算出する検索スコア算出手段と、検索スコア算出手段から得られた検索スコアをもとに検索結果を出力する出力手段を備えることを特徴とする文書検索装置。
IPC (2件):
G06F 17/30 ,  G06K 9/00
FI (4件):
G06F17/30 210A ,  G06F17/30 170B ,  G06F17/30 414B ,  G06K9/00 S
Fターム (8件):
5B064AA01 ,  5B064AA07 ,  5B064AB02 ,  5B064BA01 ,  5B075ND06 ,  5B075NK39 ,  5B075NK49 ,  5B075PP04
引用特許:
出願人引用 (2件) 審査官引用 (2件)

前のページに戻る