Pat
J-GLOBAL ID:200903077537074734

文書要約装置

Inventor:
Applicant, Patent owner:
Agent (1): 青山 葆 (外1名)
Gazette classification:公開公報
Application number (International application number):1993007427
Publication number (International publication number):1994215049
Application date: Jan. 20, 1993
Publication date: Aug. 05, 1994
Summary:
【要約】【目的】 特定の文書形式や文脈を仮定することなく簡単な処理によって文書における質の良い重要部分を抽出する。【構成】 文書解析部5は文書入力部1から入力された文書を段落,文および単語に分解する。文脈ベクトル生成部6は、単語辞書8を用いて文,段落および文書の文脈ベクトルを生成する。文脈ベクトル比較部7は、文書と各段落毎の文,文書と各段落,段落と段落内の各文および文書と各文の文脈ベクトルを比較して各文脈ベクトル間距離算出する。文書処理部4は、各文脈ベクトル間距離を参照して、文書に最も近い段落と文書に近い複数文との2種類の要旨及び文書に最も近い各段落毎の文と各段落に最も近い文との2種類の要約を生成する。このように、入力文書を文脈ベクトルを用いて解析することによって、特定の文書形式や文脈を仮定することなく質の良い重要部分を簡単な処理で抽出できる。
Claim (excerpt):
単語の特徴ベクトルが格納された単語辞書と、文書入力部から入力された文書に対して所定の解析を行って、上記入力文書を段落,文および単語に分割する文書解析部と、上記分割された単語の特徴ベクトルを上記単語辞書を用いて求め、さらにこの求められた単語の特徴ベクトルに基づいて、上記分割された文および段落と上記入力文書の特徴ベクトルを所定の手順によって生成する特徴ベクトル生成部と上記入力文書,段落および文の特徴ベクトル間の距離を所定の手順によって算出する距離算出部と、上記算出された各特徴ベクトル間の距離に基づいて、上記入力文書の要約を所定の手順によって生成する文書要約生成部を備えたことを特徴とする文書要約装置。
IPC (2):
G06F 15/401 ,  G06F 15/20 550

Return to Previous Page