特許
J-GLOBAL ID:200903008583321981

記号的圧縮文書画像からの情報抽出方法

発明者:
出願人/特許権者:
代理人 (1件): 伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2000-106969
公開番号(公開出願番号):特開2000-353962
出願日: 2000年04月07日
公開日(公表日): 2000年12月19日
要約:
【要約】【課題】 本発明は、記号的圧縮文書画像からの情報抽出方法及び装置の提供を目的とする。【解決手段】 解読モジュールは第1及び第2の記号的圧縮文書画像の夫々のテンプレート識別子のシーケンスを解読することにより第1及び第2のテキスト文字列を生成する。条件付きn-グラムジュールは第1及び第2のテキスト文字列から予測条件に基づいてn-グラム項を抽出する。比較モジュールは抽出されたn-グラム項に基づいて第1及び第2の記号的圧縮文書画像間の類似性の測度を生成する。
請求項(抜粋):
入力文書画像が使用する記憶容量を減少させるため、テンプレート識別子のシーケンスを用いて入力文書画像を表現し、上記入力文書画像中のテキストを表わすテキスト文字列を生成するため、言語統計量に従って上記テンプレート識別子をアルファベット文字で置換する方法。
IPC (3件):
H03M 7/30 ,  H04N 1/40 ,  H04N 1/41
FI (3件):
H03M 7/30 Z ,  H04N 1/41 Z ,  H04N 1/40 Z
引用特許:
出願人引用 (6件)
全件表示
審査官引用 (6件)
全件表示

前のページに戻る