Pat
J-GLOBAL ID:200903040339531193

文書要約装置及びコンピュータ読み取り可能な記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 梅田 勝
Gazette classification:公開公報
Application number (International application number):1997263318
Publication number (International publication number):1999102372
Application date: Sep. 29, 1997
Publication date: Apr. 13, 1999
Summary:
【要約】【課題】 新聞記事から要約を抽出するには、文書の意味を扱う必要があるが、従来は特定の文書形式や文脈を仮定する必要があった。【解決手段】 タイトル抽出部9は文書入力部1から入力された文書からタイトルと本文を抽出し、文書解析部5はタイトルを単語に、本文を文および単語に分解する。文脈ベクトル生成部6は、単語辞書8を用いてタイトルおよび本文中の文の文脈ベクトルを生成する。文脈ベクトル比較部7は、タイトルと本文中の各文の文脈ベクトルを比較して各文脈ベクトル間距離を算出する。文書処理部4は各文脈ベクトル間距離を参照して、タイトルに近い複数文を生成して文書の重要部分とする。このように、入力文書を文脈ベクトルを用いて解析することによって、特定の文書形式や文脈を仮定することなく、質の良い重要部分を簡単な処理で抽出できる。
Claim (excerpt):
入力された文書のタイトルと本文から要約を作成する文書要約装置であって、単語の文脈ベクトルが格納された単語辞書と、上記タイトルを単語に、上記本文を文および単語にそれぞれ分解する文書解析手段と、上記単語辞書を参照して上記タイトルの文脈ベクトル及び上記分割された文の文脈ベクトルを生成する文脈ベクトル生成手段と、上記タイトルの文脈ベクトルと上記分割された文の文脈ベクトルとの距離を算出する距離算出手段と、上記算出された距離に基づいて上記本文から少なくとも一つの文を要約として選出する選択手段と、を備えることを特徴とする文書要約装置。
IPC (2):
G06F 17/30 ,  G06F 17/27
FI (3):
G06F 15/401 320 A ,  G06F 15/20 550 F ,  G06F 15/40 370 A
Patent cited by the Patent:
Cited by applicant (1)
  • 文書要約装置
    Gazette classification:公開公報   Application number:特願平5-007427   Applicant:シャープ株式会社
Cited by examiner (1)
  • 文書要約装置
    Gazette classification:公開公報   Application number:特願平5-007427   Applicant:シャープ株式会社

Return to Previous Page