特許
J-GLOBAL ID:200903073340683849

文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法

発明者:
出願人/特許権者:
代理人 (1件): 川井 隆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-218229
公開番号(公開出願番号):特開平11-045288
出願日: 1997年07月29日
公開日(公表日): 1999年02月16日
要約:
【要約】【課題】 複数の文書がドキュメント単位でどれだけ似ているかを判定して、その類似度の高い文書を纏め、各文書群毎に要約を作成して読み易い要約を作成できる文書処理装置および文書作成方法を提供すること。【解決手段】 要約しようとする複数の文書毎の文書ベクトルを求め、各文書間で文書ベクトルの差をとる。これらの連続する2つの文書間のコサインバリュー(cosine value)が高いか低いかでトピックの同一性を判断する。同じトッピクに属する(即ち類似度が高い場合)とされた文書は、執筆の時間順に纏められでサマリー抽出アルゴリズムにかける。これを各トピックに属するとされた文書毎に繰り返し、各部分サマリーを結合して全体サマリーを生成する。
請求項(抜粋):
所定形式の文書を複数個取得する文書取得手段と、前記文書取得手段により取得された各文書間の類似度を算出する類似度算出手段と、前記類似度算出手段で算出された各文書間の類似度から内容の類似した文書を纏めた類似文書群を作成する類似文書群作成手段と、この類似文書群作成手段により作成された類似文書群毎に文書の要約を自動的に作成する要約作成手段と、を備えたことを特徴とする文書処理装置。
IPC (2件):
G06F 17/30 ,  G06F 17/27
FI (4件):
G06F 15/401 320 A ,  G06F 15/20 550 A ,  G06F 15/40 370 A ,  G06F 15/403 350 C
引用特許:
審査官引用 (5件)
全件表示

前のページに戻る