特許
J-GLOBAL ID:200903019184571178

文書電子化装置

発明者:
出願人/特許権者:
代理人 (1件): 佐藤 幸男 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-050961
公開番号(公開出願番号):特開平9-223240
出願日: 1996年02月14日
公開日(公表日): 1997年08月26日
要約:
【要約】【課題】 文章だけでなく、図・表、写真、グラフィックスを含む既存の印刷文書からWWWサービスに利用することができるHTML形式のハイパーテキストを自動的に作成する。【解決手段】 領域識別部2が、文字の領域と写真・図表の領域とを識別し、文字認識部3が、文字の領域にある文字を認識し、認識し難い文字についてはイメージとして処理し、文字コード化部5が、それらの文字を文字コードへ変換する一方で、画像番号付与部7が、写真・図表の画像データに対し画像番号を付与し、最後に、ハイパーテキスト化部6が、文字コードと画像番号とにより、ハイパーテキスト形式のファイルを作成する。
請求項(抜粋):
文書を光学的に読み取って得られる画像データについて、文字が書かれている文字領域であるか、文字として認識しない画像領域であるかを識別する領域識別部と、前記文字領域中に存在する文字を認識する文字認識部と、前記認識した文字領域中の文字を文字コードに変換する文字コード化部と、前記画像領域を画像として切り出して画像データファイルを作成する画像処理部と、前記文字コードと前記画像データファイルとによりハイパーテキスト形式の複合データファイルを作成するハイパーテキスト化部とを有することを特徴とする文書電子化装置。
IPC (4件):
G06T 11/60 ,  G06F 12/00 547 ,  G06F 17/30 ,  G06K 9/00
FI (5件):
G06F 15/62 325 A ,  G06F 12/00 547 H ,  G06K 9/00 S ,  G06F 15/401 330 Z ,  G06F 15/403 310 C

前のページに戻る