Pat
J-GLOBAL ID:200903016160579810

数式認識装置および数式認識方法並びに文字認識装置および文字認識方法

Inventor:
Applicant, Patent owner:
Agent (1): 鈴江 武彦 (外6名)
Gazette classification:公開公報
Application number (International application number):2001063968
Publication number (International publication number):2002269499
Application date: Mar. 07, 2001
Publication date: Sep. 20, 2002
Summary:
【要約】【課題】数式を含む文書から高い精度で数式を認識することが可能なOCRシステムを実現する。【解決手段】数式検出部113では、形式文法と各単語毎に算出されるテキストおよび数式それぞれの評価値とに基づいて、単語毎にテキストおよび数式のいずれかを選択しながら単語間を接続するための最適な経路が探索され、数式領域が検出される。続く数式認識部114では、前後の文字種類別に異なる複数の散布図を用いることにより、水平位置関係、下付添え字関係、上付添え字関係についての判定がなされる。そして、各文字間の局所的な関係の判定のみならず、大域的な評価条件を考慮して最適な経路を探索することにより、文字間毎に生成されたリンク候補の中から最適な経路が決定され、文字間の添え字関係が確定される。
Claim (excerpt):
数式を含む文書イメージの文字認識を行う文字認識手段と、正規表現により特定可能な単語種別毎にそれがテキストと数式に該当する可能性をそれぞれ示す評価値を定義した第1の知識辞書と、前記第1の知識辞書を参照して、前記文字認識手段によって得られた文字認識結果に含まれる各単語についてテキストおよび数式それぞれに該当する評価値を得る手段と、形式文法と前記各単語毎に算出されるテキストおよび数式それぞれの評価値とに基づいて、単語毎にテキストおよび数式のいずれかを選択しながら単語間を接続するための最適な経路を探索し、その探索結果に基づいて数式に該当する単語を検出する数式検出手段とを具備することを特徴とする数式認識装置。
IPC (3):
G06K 9/72 ,  G06K 9/00 ,  G06K 9/46
FI (3):
G06K 9/72 E ,  G06K 9/00 P ,  G06K 9/46 G
F-Term (9):
5B064AA01 ,  5B064AB02 ,  5B064AB13 ,  5B064AB17 ,  5B064AB18 ,  5B064BA01 ,  5B064CA11 ,  5B064EA19 ,  5B064EA20
Article cited by the Patent:
Return to Previous Page