特許
J-GLOBAL ID:200903090454894957

テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム

発明者:
出願人/特許権者:
代理人 (3件): 机 昌彦 ,  木村 明隆 ,  浅井 俊雄
公報種別:公開公報
出願番号(国際出願番号):特願2009-069851
公開番号(公開出願番号):特開2009-146446
出願日: 2009年03月23日
公開日(公表日): 2009年07月02日
要約:
【課題】短時間で、かつ、品質の良い要約を生成することができるテキスト要約の実現。【解決手段】要約構成単位の認定手段101が、入力テキストの各文に対して要約構成単位認定用言語知識情報104を適用して述部を含む節を最小とする単位を要約構成単位として認定し、次に、要約構成単位の重要度計算手段102が要約構成単位に対して、テキスト中での要約構成単位の位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、要約結果出力手段103が抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。【選択図】 図1
請求項(抜粋):
入力文全体に照合するパタンであって、かつ、該パタンの中に文の述部を含む節に照合するパタンである抽出部を包含するパタンである、照合条件と、前記抽出部を包含する複数の要約構成単位の形態を対応させた要約構成単位認定パタンとを格納する要約構成単位認定パタン記憶部と、 文を入力して、当該入力文と前記照合条件を照合して合致すると、当該入力文から前記照合条件の前記抽出部に相当する部分(相当部分)を抽出して、前記要約構成単位の形態の前記抽出部を前記相当部分で置換して、複数の要約構成単位を得る要約構成単位の認定手段と、 前記複数の要約構成単位に関するパタンである補完・修正条件と、前記複数の要約構成単位の少なくとも一つを補完・修正する為の補完・修正情報を対応させた要約構成単位補完修正パタンを格納する要約構成単位補完修正パタン記憶部と、 前記複数の要約構成単位と前記補完・修正条件を照合して合致すると、前記補完・修正情報に基づいて、第1の前記要約構成単位から得られる情報で第2の前記要約構成単位を補完・修正する要約構成単位の補完修正手段と、 前記補完修正手段によって補完・修正された要約構成単位を選択して組み合わせ、所定の要約長の要約の候補を複数作成する探索手段と、 前記探索手段によって得られるそれぞれの要約の候補において、当該要約の候補に含まれる第1の前記要約構成単位と第2の前記要約構成単位が当該要約の候補中において隣接する関係にあり、かつ、第1の前記要約構成単位と第2の前記要約構成単位が前記入力文から抽出された際のそれぞれの相当部分が同一文中の隣接する部分である場合に、第1と第2の要約構成単位間での補完・修正箇所は、補完・修正前の表現に還元する表現の還元手段と、 前記表現の還元手段によって得られた要約の候補を構成する要約構成単位の重要度を計算する要約構成単位の重要度計算手段と、 前記要約の候補に含まれる前記要約構成単位の重要度の合計から、前記要約の候補の要約スコアを計算し、最大の当該要約スコアを持つ前記要約の候補を選択して出力する前記要約結果出力手段と、 を有することを特徴とするテキスト要約システム。
IPC (2件):
G06F 17/30 ,  G06F 17/21
FI (3件):
G06F17/30 220A ,  G06F17/30 170A ,  G06F17/21 550A
Fターム (5件):
5B075ND03 ,  5B075NS01 ,  5B075QM06 ,  5B109QA04 ,  5B109QA05
引用特許:
審査官引用 (5件)
全件表示
引用文献:
前のページに戻る