特許
J-GLOBAL ID:200903050294343663
書類の走査画像からのタイトル、見出しおよび写真抽出
発明者:
,
出願人/特許権者:
代理人 (1件):
青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-008773
公開番号(公開出願番号):特開平10-260993
出願日: 1998年01月20日
公開日(公表日): 1998年09月29日
要約:
【要約】【課題】 ビットマップ画像データから関連要素を抽出して個々の文字を表わすか、或はテキストでない画像領域を表わす要素又は関連要素を同定する。【解決手段】 抽出された関連要素を各要素を構成するホール、円弧、線端等の幾何学的属性に基づいてテキストか非テキストかを分類する。次いで、最近傍分析を行ってどのテキスト要素がテキストの行やストリングスを表わすかを同定するとともに、各行やストリングスが縦向きか横向きかを決定するため分析される。その後、個別の垂直および水平のフォント高フィルタが使用され、最も確からしい候補であるテキストストリングスを同定する。最も確からしいタイトル候補について、更なる処理や表示のためタイトル領域を選択するためもともとのビットマップデータに関連付けられるかその上に置くことができる仕切りボックスが定義される。表題および写真についても位置を特定することができる。ビットマップ画像データからインデックを作成することができ、インデックをキーワードとする検索が可能となる。
請求項(抜粋):
コンピュータを用いて画像データ内のタイトルを区画する方法は以下のステップからなる:画像データをバッファ内に格納する;複数の関連する要素を同定するとともに、関連する要素に対応する対象データを格納するための第1データ構造を生成するため格納画像データについて関連要素の抽出を行う;第1データ構造内に格納された対象データの各々について、対応する関連要素の形状を反映する第1の属性と対応する関連要素の幾何学的特性を反映する第2の属性とを少なくとも同定するとともに第1データ構造との関連において上記第1,第2の属性を格納する;少なくとも第1の属性を分析してどの対象データがテキストを表わす画像データに対応するかを同定する;少なくともテキストの1行の少なくとも一部を表わす画像データに対応する少なくとも1つの最も近傍の図形を構成するため上記対象データについて最近傍分析を実行する;テキストを表わす画像データに対応した関連要素の平均的な幾何学的特性を決定するため第2の属性を分析する;少なくともテキストの1行を表わす画像データに対応する最近傍図形の各々について、各図形に関連する対象データの格納された第2の属性を上記平均的幾何学的特性と比較する;要素対象データが上記平均的幾何学的特性と実質的に異なる第2の属性を有する最近傍の図形をタイトル候補として選択する;上記タイトル候補の各々について仕切りボックスを画成するとともに、少なくとも一つの合併仕切りボックスを画成するために、少なくともテキストの一行に対応するタイトル候補の仕切りボックスを併合する;および上記合併仕切りボックスを格納画像データと関連させ、上記合併仕切りボックスがタイトルを表わす格納画像データの部分を区画する。
IPC (3件):
G06F 17/30
, G06K 9/20 340
, H04N 1/21
FI (4件):
G06F 15/40 370 B
, G06K 9/20 340 J
, H04N 1/21
, G06F 15/401 310 A
引用特許:
審査官引用 (3件)
-
特開平2-023468
-
特開平3-014184
-
文字形状整形装置
公報種別:公開公報
出願番号:特願平4-028256
出願人:株式会社リコー
前のページに戻る