特許
J-GLOBAL ID:200903041745761139

文書処理装置、文書処理方法、および記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 石井 康夫 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-274732
公開番号(公開出願番号):特開平10-074250
出願日: 1996年10月17日
公開日(公表日): 1998年03月17日
要約:
【要約】【課題】 文書登録時に少ない計算機パワーでしかも高速に登録処理が行なえるとともに、検索時には漏れの少ない検索を実現することのできる文書ファイリングを提供する。【解決手段】 類似文字分類部11において、文字画像をその画像特徴をもとに類似した文字ごとに類似文字カテゴリにあらかじめ分類し、分類されたカテゴリをその代表となる画像特徴とともに記憶しておく。文書画像登録時には、擬似文字認識部12において、そのテキスト領域の各文字を認識せずに、文字認識を行なうよりも少ない画像特徴をもとに文字カテゴリに分類し、各文字ごとに識別されたカテゴリ列を入力画像とともに記憶しておく。検索時には検索実行部13において、検索キーワードの各文字を対応するカテゴリに変換し、変換されたカテゴリ列を一部に含む文書を検索結果として取り出す。
請求項(抜粋):
文字の画像特徴をもとに類似した文字ごとに分類されたカテゴリを前記画像特徴と対応づけて記憶しておく文字カテゴリ記憶手段と、入力された文書画像中の文字ごとに画像を切り出すテキスト領域抽出手段と、該テキスト領域抽出手段によって切り出された各文字画像を所定の画像特徴をもとに前記文字カテゴリ記憶手段に記憶されているカテゴリに分類する擬似文字認識手段と、該擬似文字認識手段によって分類された前記各文字画像のカテゴリを前記入力された文書画像と対応づけて記憶しておく擬似文字認識結果記憶手段と、検索時に入力された検索式中のキーワードの各文字を前記文字カテゴリ記憶手段に記憶されている対応するカテゴリに変換するキーワード変換手段と、該キーワード変換手段によってカテゴリに変換された検索式を満たすカテゴリを有する文書画像を前記擬似文字認識結果記憶手段から取り出す文書検索手段を具備することを特徴とする文書処理装置。
IPC (3件):
G06T 1/00 ,  G06F 17/21 ,  G06F 17/30
FI (4件):
G06F 15/62 330 A ,  G06F 15/20 570 N ,  G06F 15/403 310 C ,  G06F 15/403 330 B

前のページに戻る