Pat
J-GLOBAL ID:200903073340683849
文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法
Inventor:
Applicant, Patent owner:
Agent (1):
川井 隆 (外1名)
Gazette classification:公開公報
Application number (International application number):1997218229
Publication number (International publication number):1999045288
Application date: Jul. 29, 1997
Publication date: Feb. 16, 1999
Summary:
【要約】【課題】 複数の文書がドキュメント単位でどれだけ似ているかを判定して、その類似度の高い文書を纏め、各文書群毎に要約を作成して読み易い要約を作成できる文書処理装置および文書作成方法を提供すること。【解決手段】 要約しようとする複数の文書毎の文書ベクトルを求め、各文書間で文書ベクトルの差をとる。これらの連続する2つの文書間のコサインバリュー(cosine value)が高いか低いかでトピックの同一性を判断する。同じトッピクに属する(即ち類似度が高い場合)とされた文書は、執筆の時間順に纏められでサマリー抽出アルゴリズムにかける。これを各トピックに属するとされた文書毎に繰り返し、各部分サマリーを結合して全体サマリーを生成する。
Claim (excerpt):
所定形式の文書を複数個取得する文書取得手段と、前記文書取得手段により取得された各文書間の類似度を算出する類似度算出手段と、前記類似度算出手段で算出された各文書間の類似度から内容の類似した文書を纏めた類似文書群を作成する類似文書群作成手段と、この類似文書群作成手段により作成された類似文書群毎に文書の要約を自動的に作成する要約作成手段と、を備えたことを特徴とする文書処理装置。
IPC (2):
FI (4):
G06F 15/401 320 A
, G06F 15/20 550 A
, G06F 15/40 370 A
, G06F 15/403 350 C
Patent cited by the Patent:
Cited by examiner (5)
-
ドキュメントコレクションの探索方法
Gazette classification:公開公報
Application number:特願平5-162989
Applicant:ゼロックスコーポレイション
-
電子会議システム
Gazette classification:公開公報
Application number:特願平5-200644
Applicant:株式会社東芝
-
文書分類装置
Gazette classification:公開公報
Application number:特願平5-259809
Applicant:シャープ株式会社
-
文書分類装置及び文書検索装置
Gazette classification:公開公報
Application number:特願平7-151640
Applicant:シャープ株式会社
-
文書検索装置
Gazette classification:公開公報
Application number:特願平5-349529
Applicant:株式会社東芝
Show all
Return to Previous Page