特許
J-GLOBAL ID:201003051317111126

テキスト要約装置、その方法およびプログラム

発明者:
出願人/特許権者:
代理人 (3件): 吉田 精孝 ,  長内 行雄 ,  柳 順一郎
公報種別:公開公報
出願番号(国際出願番号):特願2008-301058
公開番号(公開出願番号):特開2010-128677
出願日: 2008年11月26日
公開日(公表日): 2010年06月10日
要約:
【課題】CGM文書等に対し、ユーザより入力された検索語に適合するquery-biasedな要約を生成すること。【解決手段】関連度計算部4が、コーパスにおける任意の単語の文書頻度および2個以上の任意の単語の共起頻度を格納する単語頻度テーブル1から、検索語入力部2で受け付けた検索語の文書頻度、文書入力部3で受け付けた入力文書に含まれる単語の文書頻度、並びに検索語および入力文書に含まれる単語に対応する共起頻度を取得し、これらに基づいて関連度を計算し、重要文選択部5が、入力文書を構成する全ての文に対し、関連度計算部4で計算される当該文に含まれる各単語と検索語との関連度に基づいて文重要度を計算し、当該文重要度の高い文を選択し、制御部6が、予め指定された制限文字数または要約率の範囲内で入力文書を構成する文を文重要度の高い順に選択し、出現順に並べ替えて出力する。【選択図】図1
請求項(抜粋):
複数の文で構成される入力文書から少なくとも1つの文を選択して当該入力文書に対応する要約を生成するテキスト要約装置であって、 コーパスにおける任意の単語の文書頻度および2個以上の任意の単語の共起頻度を格納する単語頻度テーブルと、 ユーザより入力された検索語を受け付ける検索語入力部と、 形態素解析済みの入力文書を受け付ける文書入力部と、 単語頻度テーブルから、前記検索語に対応する文書頻度、前記入力文書に含まれる単語に対応する文書頻度、並びに前記検索語および入力文書に含まれる単語に対応する共起頻度を取得し、これらに基づいて前記検索語と入力文書に含まれる単語との関連度を計算する関連度計算部と、 前記入力文書を構成する全ての文に対し、関連度計算部で計算される当該文に含まれる各単語と前記検索語との関連度に基づいて文重要度を計算し、当該文重要度の高い文を選択する重要文選択部と、 前述した各部を制御し、予め指定された制限文字数または要約率の範囲内で前記入力文書を構成する文を前記文重要度の高い順に選択し、出現順に並べ替えて出力する制御部とを備えた ことを特徴とするテキスト要約装置。
IPC (1件):
G06F 17/30
FI (3件):
G06F17/30 220A ,  G06F17/30 170A ,  G06F17/30 350C
Fターム (7件):
5B075KK02 ,  5B075ND03 ,  5B075NS01 ,  5B075PQ02 ,  5B075PQ46 ,  5B075PR06 ,  5B075UU40
引用特許:
審査官引用 (1件)
  • 文書要約装置
    公報種別:公開公報   出願番号:特願平9-350465   出願人:松下電器産業株式会社
引用文献:
審査官引用 (3件)

前のページに戻る