特許
J-GLOBAL ID:200903090280972740
要点抽出方法
発明者:
出願人/特許権者:
代理人 (1件):
佐藤 幸男 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-157723
公開番号(公開出願番号):特開平9-319768
出願日: 1996年05月29日
公開日(公表日): 1997年12月12日
要約:
【要約】【課題】 文章中の各文中の語句の参照関係や文章の構造情報等を用いることなく、文章中の重要部分を抽出する。【解決手段】 要点抽出対象の文章が入力されると(ステップS1)、形態素解析を行って(ステップS2)、単語を抽出する。次いで、各単語を軸とする単語ベクトルを設定すると共に(ステップS3)、各単語に重み付けの値を付与する(ステップS4)。更に、各パラグラフの類似度を単語ベクトルの値を用いて計算する(ステップS5)。このパラグラフの類似度からクラスタを生成し(ステップS6)、その結果を出力する(ステップS7)。
請求項(抜粋):
自然言語で記述された文章中の各パラグラフを、当該文章中に出現する各単語を軸とし、各軸に対して、各々のパラグラフに出現する回数を対応させた単語ベクトルで表し、各パラグラフの単語ベクトルの類似度を計算し、前記単語ベクトルの最も類似度の高いパラグラフを、前記文章における最も重要な部分として出力することを特徴とする要点抽出方法。
IPC (2件):
G06F 17/30
, G06F 15/18 560
FI (2件):
G06F 15/401 320 A
, G06F 15/18 560 J
引用特許:
審査官引用 (5件)
-
文書要約装置
公報種別:公開公報
出願番号:特願平5-007427
出願人:シャープ株式会社
-
特開平3-278270
-
特開平4-068464
全件表示
前のページに戻る