特許
J-GLOBAL ID:200903040339531193

文書要約装置及びコンピュータ読み取り可能な記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 梅田 勝
公報種別:公開公報
出願番号(国際出願番号):特願平9-263318
公開番号(公開出願番号):特開平11-102372
出願日: 1997年09月29日
公開日(公表日): 1999年04月13日
要約:
【要約】【課題】 新聞記事から要約を抽出するには、文書の意味を扱う必要があるが、従来は特定の文書形式や文脈を仮定する必要があった。【解決手段】 タイトル抽出部9は文書入力部1から入力された文書からタイトルと本文を抽出し、文書解析部5はタイトルを単語に、本文を文および単語に分解する。文脈ベクトル生成部6は、単語辞書8を用いてタイトルおよび本文中の文の文脈ベクトルを生成する。文脈ベクトル比較部7は、タイトルと本文中の各文の文脈ベクトルを比較して各文脈ベクトル間距離を算出する。文書処理部4は各文脈ベクトル間距離を参照して、タイトルに近い複数文を生成して文書の重要部分とする。このように、入力文書を文脈ベクトルを用いて解析することによって、特定の文書形式や文脈を仮定することなく、質の良い重要部分を簡単な処理で抽出できる。
請求項(抜粋):
入力された文書のタイトルと本文から要約を作成する文書要約装置であって、単語の文脈ベクトルが格納された単語辞書と、上記タイトルを単語に、上記本文を文および単語にそれぞれ分解する文書解析手段と、上記単語辞書を参照して上記タイトルの文脈ベクトル及び上記分割された文の文脈ベクトルを生成する文脈ベクトル生成手段と、上記タイトルの文脈ベクトルと上記分割された文の文脈ベクトルとの距離を算出する距離算出手段と、上記算出された距離に基づいて上記本文から少なくとも一つの文を要約として選出する選択手段と、を備えることを特徴とする文書要約装置。
IPC (2件):
G06F 17/30 ,  G06F 17/27
FI (3件):
G06F 15/401 320 A ,  G06F 15/20 550 F ,  G06F 15/40 370 A
引用特許:
審査官引用 (1件)
  • 文書要約装置
    公報種別:公開公報   出願番号:特願平5-007427   出願人:シャープ株式会社

前のページに戻る