特許
J-GLOBAL ID:200903034737179564
文書処理装置および文書処理方法
発明者:
出願人/特許権者:
代理人 (8件):
鈴江 武彦
, 河野 哲
, 中村 誠
, 蔵田 昌俊
, 峰 隆司
, 福原 淑弘
, 村松 貞男
, 橋本 良郎
公報種別:公開公報
出願番号(国際出願番号):特願2006-348367
公開番号(公開出願番号):特開2007-095102
出願日: 2006年12月25日
公開日(公表日): 2007年04月12日
要約:
【課題】印刷文書に記載されている内容を抽出・構造化してコンピュータに自動入力できるようにすること。【解決手段】文書画像からレイアウトオブジェクトと構造を抽出する手段1と、文書画像から抽出したテキストの領域からタイポグラフィーに基づいて段落、リスト、数式、プログラム、注釈等の論理オブジェクトを抽出する手段3と、オブジェクト間の複数の可能な読み順を抽出する手段5と、論理オブジェクトに対して予め定義されているモデルを適用して論理構造を抽出する手段4と、から構成され、文字、写真、図形、表などで構成される多様な複数頁構成の文書からでも一次情報二次情報を抽出し、多様な電子フォーマットに変換可能にすることにより、文書管理システムの自動構築や様々な計算機アプリケーションの有効活用を可能にする。【選択図】図1
請求項(抜粋):
論理オブジェクトを隣接関係、配置関係、文字行方向の同一性、属性関係、又は同一のレイアウトオブジェクトから派生したものであるかどうかに基づいてグループ化する手段と、
全ての論理要素を含む文書全体の組み形式を判定する手段と、
前記文書全体の組み形式に基づいて、論理オブジェクトのグループ間の読み順を決定する手段と、
文書全体の組み形式と異なる論理オブジェクトのグループが連続する場合には、そのグループの読み順を変更する手段と、
論理オブジェクトのグループ内の読み順を決定する手段と、
前記論理オブジェクトのグループ間の読み順と前記論理オブジェクトのグループ内の論理オブジェクトの読み順との整合を得て文書全体に対する各論理オブジェクトの読み順を決定する手段と、を具備することを特徴とする文書処理装置。
IPC (2件):
FI (4件):
G06F17/21 530A
, G06K9/20 340J
, G06K9/20 320J
, G06K9/20 320K
Fターム (14件):
5B009NA01
, 5B009QA06
, 5B009QA11
, 5B029AA01
, 5B029BB02
, 5B029CC13
, 5B029CC18
, 5B029CC20
, 5B029CC21
, 5B029CC22
, 5B029CC23
, 5B029CC27
, 5B029CC28
, 5B029CC29
引用特許:
前のページに戻る