特許
J-GLOBAL ID:200903065094754933

主題文抽出方式

発明者:
出願人/特許権者:
代理人 (1件): 上村 輝之
公報種別:公開公報
出願番号(国際出願番号):特願平10-196918
公開番号(公開出願番号):特開2000-029894
出願日: 1998年07月13日
公開日(公表日): 2000年01月28日
要約:
【要約】【課題】 予め抽出すべき情報が分かっていないときでも、電子化テキストから主題文の抽出を行えるようにする。【解決手段】 主題文の抽出対象である文章データ中の固有名詞、普通名詞、サ変名詞等の各名詞にスコアを付与した後(ステップS11)、これらのスコアを各文毎に加算して各文毎のスコアを求める(ステップS12)。文章データ中のn番目(任意の順番)の文LnにおけるスコアSnを、Sn=Ln により求める。各文の関数F(Ln)のうちから、その極大値を与える文Lmを文章データの主題文に決定する(ステップS14)。主題文の長さが所定の長さに制限されるときは、主題文の文字数と原文章の文字数とを要素にして定義される要約率を用いて主題文の長さを調整し(ステップS16)、一連の処理動作を終了する。要約率を変化させる必要がないと判断したときは(ステップS15)、直ちに一連の処理動作を終了する。
請求項(抜粋):
文章データに含まれる複数の単語に夫々重み付けする手段と、前記各単語に付与された夫々の重みに基づき、前記文章データを構成する各文毎の重みを求める手段と、前記各文毎の重みの比較結果に基づき、前記文章データにおける主題文を決定する手段と、を備える主題文抽出方式。
IPC (2件):
G06F 17/30 ,  G06F 17/27
FI (4件):
G06F 15/401 320 A ,  G06F 15/38 D ,  G06F 15/40 370 A ,  G06F 15/403 350 C
Fターム (19件):
5B075ND03 ,  5B075NS01 ,  5B075PP30 ,  5B075PQ00 ,  5B075PR10 ,  5B075QM10 ,  5B075QP10 ,  5B075UU05 ,  5B075UU11 ,  5B075UU40 ,  5B091AA15 ,  5B091BA02 ,  5B091BA03 ,  5B091CA02 ,  5B091CA22 ,  5B091CA24 ,  5B091CC02 ,  5B091DA04 ,  5B091DA13

前のページに戻る