特許
J-GLOBAL ID:201103043336327428

数式認識装置および数式認識方法

発明者:
出願人/特許権者:
代理人 (7件): 鈴江 武彦 ,  村松 貞男 ,  橋本 良郎 ,  河野 哲 ,  中村 誠 ,  河井 将次 ,  鈴江 武彦
公報種別:特許公報
出願番号(国際出願番号):特願2001-063968
公開番号(公開出願番号):特開2002-269499
特許番号:特許第4181310号
出願日: 2001年03月07日
公開日(公表日): 2002年09月20日
請求項(抜粋):
【請求項1】 数式を含む文書イメージの文字認識を行う文字認識手段と、 正規表現により特定可能な単語種別毎にそれがテキストと数式に該当する可能性をそれぞれ示す評価値を定義した第1の知識辞書と、 前記第1の知識辞書を参照して、前記文字認識手段によって得られた文字認識結果に含まれる各単語についてテキストおよび数式それぞれに該当する評価値を得る手段と、 形式文法と前記各単語毎に算出されるテキストおよび数式それぞれの評価値とに基づいて、単語毎にテキストおよび数式のいずれかを選択しながら単語間を接続するための最適な経路を探索し、その探索結果に基づいて数式に該当する単語を検出する数式検出手段と、 前後の文字が水平位置、下付添え字、上付添え字それぞれの関係にある場合におけるそれら前後の文字間における正規化サイズとその中心位置の関係を示すサンプル値を、前記正規化サイズおよび前記中心位置をそれぞれ軸とする散布図上に記したサンプル情報を、前後の文字種類別に複数記憶する手段と、 前記数式検出手段で検出された数式内に含まれる前後の文字毎に、正規化サイズとその中心位置の関係を算出し、その算出結果が、前記前後の文字の文字種類の関係に対応するサンプル情報の散布図内において、水平位置関係にある文字間のサンプル値が分布する領域、下付添え字関係にある文字間のサンプル値が分布する領域、付添え字関係にある文字間のサンプル値が分布する領域のいずれに属するかを評価することによって、前記数式内に含まれる前記前後の文字間毎に、水平位置関係、下付添え字関係、上付添え字関係の中で該当する可能性のある文字間構造候補とその評価値から成るリンク候補を得る文字間構造判定手段と、 前記数式内に含まれる文字それぞれの文字高さの分布に基づいて予め決められ、前記数式内の文字同士を矛盾なく接続可能な文字間構造候補の経路の合計評価値を修正するための大域的評価条件であって、添え字領域に含まれる文字の正規化サイズが水平領域に含まれる文字の正規化サイズ以上である場合に前記合計評価値を下げるという条件、水平領域に含まれる文字間の正規化サイズに一定値以上のバラツキがある場合に前記合計評価値を下げるという条件のうちの少なくとも1つを含む大域的評価条件と、前記リンク候補とに基づいて、前記数式内に含まれる前記前後の文字間毎に水平位置関係、下付添え字関係、上付添え字関係のいずれかの文字間構造候補を選択しながら、前記数式内の文字同士を矛盾なく接続可能な経路の中で合計評価値が最大となる経路を探索することによって、前後の文字間毎に水平位置関係、下付添え字関係、上付添え字関係のいずれに該当するかを決定する数式認識手段とを具備することを特徴とする数式認識装置。
IPC (3件):
G06K 9/72 ( 200 6.01) ,  G06K 9/00 ( 200 6.01) ,  G06K 9/46 ( 200 6.01)
FI (3件):
G06K 9/72 E ,  G06K 9/00 P ,  G06K 9/46 G
引用文献:
前のページに戻る