特許
J-GLOBAL ID:200903059520292519

文書の論理構造の解析方法及びシステム

発明者:
出願人/特許権者:
代理人 (1件): 合田 潔 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-134014
公開番号(公開出願番号):特開平8-006945
出願日: 1994年06月16日
公開日(公表日): 1996年01月12日
要約:
【要約】【目的】 文章の論理構造を、曖昧性を許容しつつ総合的に判断することを可能とする。【構成】 入力された文書は、行単位で、所定の辞書パターンとマッチングすることによって、属性とコストの組を可能的には複数付与される。文書全体につき処理が完了すると、隣り合う行間の属性の組み合わせを指定するルールに基づき、グラフのノードを生成し、且つノード間をリンクで繋ぐとともに、ノードとリンクとにコストを付与する。そのグラフを、ルート・ノードから最終ノードまで辿るには複数の経路があり、その各々が文書の可能な論理構造の解釈を意味する。辿ったノードとリンクのコストを加算することによって、各々の経路には合計コスト値を関連付けることが出来、この合計コスト値で以て優先順位を付けることにより、最も妥当と思われる経路(論理構造の解釈)から順に、複数の論理構造の解釈を示すことが可能である。選ばれた論理構造には、必要に応じて、タグが付けられる。
請求項(抜粋):
コンピュータ・システムによって可読な形式で格納された文書の論理構造を、コンピュータ・システムの処理によって解析するための方法であって、(a) 上記文書を行単位で、上記コンピュータ・システムの記憶領域に読み込む段階と、(b) 予め用意された行属性判定基準に基づき、上記読み込まれた行の属性を、複数の属性判定を許容し、且つその各々の判定に、判定の妥当性の程度を示すコスト値を関連付けるように判定する段階と、(c) 上記文書の全ての行の属性判定が完了したことに応答して、起点のノードを生成し、次に上記文書の最初の行に関して、該最初の行の属性判定の数だけノードを生成して、予め用意された、属性に基づくノード連結規則に基づき、該起点のノードと、該最初の行に関連して生成されたノードとを連結する段階と、(d) 次の行について、該次の行の属性判定の数だけノードを生成して、予め用意された、上記属性及びコスト値に基づくノード連結規則に基づき、該次の行の直前の行に関連して生成されたノードと、該次の行に関連して生成されたノードとをリンクにより連結するとともに、該生成されたノード及びリンクにコストを付与する段階と、(e) 上記段階(d)を、最後の行に到達するまで順次実行することにより、上記起点ノードから終端ノードに向かう有向グラフを形成する段階と、(f) 上記有向グラフにおいて、上記起点ノードから出発して、辿ったノード及びリンクのコストを加算しつつ、終端のノードまで到達する複数の経路を見い出す段階と、(g) 上記見い出された複数の経路を、該個別の経路に関連するコストの和に基づき順位付けする段階を有する、文書の論理構造の解析方法。
IPC (4件):
G06F 17/27 ,  G06F 17/21 ,  G06T 11/60 ,  G06K 9/62
FI (3件):
G06F 15/20 550 E ,  G06F 15/20 530 E ,  G06F 15/62 325
引用特許:
審査官引用 (8件)
  • 特開昭62-245367
  • 特開平4-120661
  • OCR入力された日本語文の後処理方法
    公報種別:公開公報   出願番号:特願平3-257194   出願人:インターナシヨナル・ビジネス・マシーンズ・コーポレイシヨン
全件表示

前のページに戻る