特許
J-GLOBAL ID:200903019594633391

特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置

発明者:
出願人/特許権者:
代理人 (1件): 船橋 國則
公報種別:公開公報
出願番号(国際出願番号):特願2004-015509
公開番号(公開出願番号):特開2005-208979
出願日: 2004年01月23日
公開日(公表日): 2005年08月04日
要約:
【課題】投影方向に画素値をそのまま累積すると、紙の地色や原稿の背景色、文書中に挿入された画像成分、罫線成分等についても累積してしまうため、投影波形中の文字成分がはっきりしなくなり、特徴量の抽出を正しく行うことができない。【解決手段】入力される多値の文書データから投影波形生成部21によって投影波形を生成する。具体的には、各文書データの画素値を水平・垂直方向に累積して投影波形データを生成する。この投影波形データを二値化部22で二値化し、黒領域・白領域のみからなる二値データ系列とする。そして、頻度分布解析部23において、二値データ系列における連続する黒領域の長さを総てについて求め、それらの値のうち出現頻度が所定のしきい値よりも高いものをこの文書データの特徴量とする。【選択図】図3
請求項(抜粋):
入力される多値の文書データから投影波形データを生成する投影波形生成手段と、 前記投影波形生成手段によって生成された前記投影波形データを二値化する二値化手段と、 前記二値化手段による二値化結果における連続する黒領域及び白領域の少なくともどちらか一方についての特徴を示す値を総てについて求めて頻度分布を解析し、その解析結果を前記文書データの特徴量とする解析手段と を備えることを特徴とする特徴量抽出装置。
IPC (2件):
G06T7/00 ,  G06T1/00
FI (2件):
G06T7/00 300G ,  G06T1/00 200D
Fターム (13件):
5B050BA10 ,  5B050BA16 ,  5B050DA06 ,  5B050EA04 ,  5B050FA19 ,  5B050GA08 ,  5L096FA32 ,  5L096FA36 ,  5L096FA37 ,  5L096FA64 ,  5L096FA66 ,  5L096FA81 ,  5L096JA11
引用特許:
出願人引用 (5件)
全件表示

前のページに戻る