特許
J-GLOBAL ID:200903077537074734
文書要約装置
発明者:
,
,
出願人/特許権者:
代理人 (1件):
青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-007427
公開番号(公開出願番号):特開平6-215049
出願日: 1993年01月20日
公開日(公表日): 1994年08月05日
要約:
【要約】【目的】 特定の文書形式や文脈を仮定することなく簡単な処理によって文書における質の良い重要部分を抽出する。【構成】 文書解析部5は文書入力部1から入力された文書を段落,文および単語に分解する。文脈ベクトル生成部6は、単語辞書8を用いて文,段落および文書の文脈ベクトルを生成する。文脈ベクトル比較部7は、文書と各段落毎の文,文書と各段落,段落と段落内の各文および文書と各文の文脈ベクトルを比較して各文脈ベクトル間距離算出する。文書処理部4は、各文脈ベクトル間距離を参照して、文書に最も近い段落と文書に近い複数文との2種類の要旨及び文書に最も近い各段落毎の文と各段落に最も近い文との2種類の要約を生成する。このように、入力文書を文脈ベクトルを用いて解析することによって、特定の文書形式や文脈を仮定することなく質の良い重要部分を簡単な処理で抽出できる。
請求項(抜粋):
単語の特徴ベクトルが格納された単語辞書と、文書入力部から入力された文書に対して所定の解析を行って、上記入力文書を段落,文および単語に分割する文書解析部と、上記分割された単語の特徴ベクトルを上記単語辞書を用いて求め、さらにこの求められた単語の特徴ベクトルに基づいて、上記分割された文および段落と上記入力文書の特徴ベクトルを所定の手順によって生成する特徴ベクトル生成部と、上記入力文書,段落および文の特徴ベクトル間の距離を所定の手順によって算出する距離算出部と、上記算出された各特徴ベクトル間の距離に基づいて、上記入力文書の要約を所定の手順によって生成する文書要約生成部を備えたことを特徴とする文書要約装置。
IPC (2件):
G06F 15/401
, G06F 15/20 550
前のページに戻る