Pat
J-GLOBAL ID:200903031756813542
文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
Inventor:
,
Applicant, Patent owner:
Agent (1):
川井 隆 (外1名)
Gazette classification:公開公報
Application number (International application number):1997217125
Publication number (International publication number):1999045278
Application date: Jul. 27, 1997
Publication date: Feb. 16, 1999
Summary:
【要約】【課題】 1文書中に複数のトピックを含むか否か判定し、各トピック毎の内容を的確に把握することが可能な要約を作成する。【解決手段】 文書Aを複数のサブ文書に分割し(S14)、各サブ文書毎の文書ベクトルbを求め(S15)、隣接する文書ベクトルb間でのコサインバリューから隣接するサブ文書同士の類似度sを求める(S16)。この類似度sの値からトピックの変わり目と予想される区切れXnを仮判定し(S17)、各区切れ毎のサブ文書群に対する文書ベクトルBと類似度Sを求め(S19、20)、類似度Sからトピックの変わり目を最終判定する(S21)。そして、トピックの変わり目と最終判定した各サブ文書群毎にサブ要約を作成し(S22)、サブ要約を合成することで要約対象文書Aの最終的な要約とする。
Claim (excerpt):
複数の文章で構成された所定形式の文書を取得する文書取得手段と、前記文書取得手段で取得された文書を複数のサブ文書に分割する文書分割手段と、前記文書分割手段により分割されたサブ文書間の類似度を算出する類似度算出手段と、前記類似度算出手段で算出されたサブ文書間の類似度から、前記文書に複数のトピックが含まれるか否かを判定する判定手段と、を備えたことを特徴とする文書処理装置。
FI (2):
G06F 15/401 320 Z
, G06F 15/40 370 A
Patent cited by the Patent:
Return to Previous Page