Pat
J-GLOBAL ID:200903019184571178
文書電子化装置
Inventor:
Applicant, Patent owner:
Agent (1):
佐藤 幸男 (外1名)
Gazette classification:公開公報
Application number (International application number):1996050961
Publication number (International publication number):1997223240
Application date: Feb. 14, 1996
Publication date: Aug. 26, 1997
Summary:
【要約】【課題】 文章だけでなく、図・表、写真、グラフィックスを含む既存の印刷文書からWWWサービスに利用することができるHTML形式のハイパーテキストを自動的に作成する。【解決手段】 領域識別部2が、文字の領域と写真・図表の領域とを識別し、文字認識部3が、文字の領域にある文字を認識し、認識し難い文字についてはイメージとして処理し、文字コード化部5が、それらの文字を文字コードへ変換する一方で、画像番号付与部7が、写真・図表の画像データに対し画像番号を付与し、最後に、ハイパーテキスト化部6が、文字コードと画像番号とにより、ハイパーテキスト形式のファイルを作成する。
Claim (excerpt):
文書を光学的に読み取って得られる画像データについて、文字が書かれている文字領域であるか、文字として認識しない画像領域であるかを識別する領域識別部と、前記文字領域中に存在する文字を認識する文字認識部と、前記認識した文字領域中の文字を文字コードに変換する文字コード化部と、前記画像領域を画像として切り出して画像データファイルを作成する画像処理部と、前記文字コードと前記画像データファイルとによりハイパーテキスト形式の複合データファイルを作成するハイパーテキスト化部とを有することを特徴とする文書電子化装置。
IPC (4):
G06T 11/60
, G06F 12/00 547
, G06F 17/30
, G06K 9/00
FI (5):
G06F 15/62 325 A
, G06F 12/00 547 H
, G06K 9/00 S
, G06F 15/401 330 Z
, G06F 15/403 310 C
Return to Previous Page