特許
J-GLOBAL ID:200903010188654119

自動要約装置および自動要約プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 谷 義一 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-270147
公開番号(公開出願番号):特開2000-099536
出願日: 1998年09月24日
公開日(公表日): 2000年04月07日
要約:
【要約】【課題】 原文と要約率から最適な要約文を得る。【解決手段】 原文を形態素解析し形態素情報を出力する装置1、要約率と原文の文字数から削減する文字数の最小値を計算する装置2、形態素情報に基づいて原文の単語列に対して置換する単語列を追加し置換コストを付与した単語ラティス構造を出力する装置3、単語ラティス構造を文末から文頭に向けて探索し文末から各ノードまでの最大文字削減数を出力する装置4、単語ラティス構造を文頭から文末に向けて探索し各パスに対して文頭からの文字削減数を計算し装置4の文字削減数との和を求め、その和が所望の文字削減数よりも小さい場合にはそのパスは枝刈りし小さくない場合にはそのパスを出力する装置5、装置5の出力パスに対して置換コストの和を計算し文末に達したとき文頭から文末までのパスを出力する装置6、装置6の出力パスの中で置換コストの和が最小となるパスを要約文として出力する装置7を有する。
請求項(抜粋):
入力された原文を形態素解析し、原文に含まれる文字列を単語に分割しその品詞を付与した形態素情報を出力する形態素解析手段と、入力された原文の要約率と入力された該原文の文字数とから削減すべき文字数の最小値を計算する文字削減数最小値計算手段と、前記形態素解析手段から出力される前記形態素情報に基づいて、前記原文の単語列に対して先頭の単語列から順に、あらかじめ得られている置換知識との照合を行い、照合に成功した場合には置換する単語列を前記形態素情報に追加し、かつその置換コストを付与した単語ラティス構造を出力する置換知識検索手段と、該置換知識検索手段から出力される前記単語ラティス構造を文末から文頭に向けて探索し、該単語ラティス構造の文末から各ノードまでの最大可能な文字削減数を計算する後向き文字削減数計算手段と、前記置換知識検索手段から出力される前記単語ラティス構造を文頭から文末に向けて探索し、各パスに対して文頭からの文字削減数を計算し、その計算結果と前記後向き文字削減数計算手段から出力された文字削減数との和を求め、その和が所望の文字削減数よりも小さい場合には、そのパスを枝刈りし、その和が所望の文字削減数よりも小さくない場合には、そのパスを出力する前向き文字削減数計算手段と、該前向き文字削減数計算手段から出力されるパスに対してその置換コストの和を計算し、文末に達したときには文頭から文末までのパスを出力する置換コスト計算手段と、該置換コスト計算手段から出力されたパスの中で、文頭から文末までの置換コストの和が最小となるパスを求め、求めた最小パスの文字列を要約文として出力する置換コスト最小パス計算手段とを有することを特徴とする自動要約装置。
FI (2件):
G06F 15/401 320 A ,  G06F 15/40 370 A
Fターム (2件):
5B075ND03 ,  5B075NS01

前のページに戻る