Pat
J-GLOBAL ID:200903084454089493

文書を要約する方法および装置

Inventor:
Applicant, Patent owner:
Agent (1): 中村 稔 (外6名)
Gazette classification:公開公報
Application number (International application number):1994142717
Publication number (International publication number):1995036896
Application date: Jun. 24, 1994
Publication date: Feb. 07, 1995
Summary:
【要約】【目的】 文書の要約を自動的に作成する方法を提供する。【構成】 本発明の方法は、文書の領域を選択することによって要約を自動的に作成する。選択した各領域はシードリストの少なくとも2つのメンバーを含んでいる。シードリストは、ストップリスト上に含まれていない、文書内の所定の数の最もひんぱんに出現する複雑な表現から作られる。要約が長過ぎる場合には、その要約に対し領域選択処理が行われ、より短い要約が作られる。この領域選択処理は所望の長さを有する要約が生じるまで繰り返される。領域選択処理が繰り返されるたびに、シードリストのメンバーがストップリストに加えられ、ひんぱんに出現する表現を識別するのに使用した複雑性レベルが減じられる。
Claim (excerpt):
文字で表現されたテキストを含んでいる文書を電子的に処理する方法であって、(a) ストップリストに含まれていなく、少なくとも第1の所定のレベルの複雑性を有する文書内の表現の出現度数を決定すること、(b) ステップ(a)において決定した、第2の所定の数の最もひんぱんに出現する表現から成るシードリストを作ること、(c) 前記シードリストの少なくとも2つのメンバーを含んでいる文書内の領域から成る文書の要約を作ること、および(d) 前記要約の長さが所定の長さ以下になるまで、前記要約に対してステップ(a)〜(c)を繰り返すこと、そしてステップ(a)〜(c)を繰り返すたびに、前記シードリスト上のメンバーを前記ストップリストに加え、前記第1の所定のレベルの複雑性を減じること、の諸ステップから成ることを特徴とする方法。

Return to Previous Page