特許
J-GLOBAL ID:201303045717482451

テキスト要約装置、方法及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人太陽国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2011-242528
公開番号(公開出願番号):特開2013-097722
出願日: 2011年11月04日
公開日(公表日): 2013年05月20日
要約:
【課題】複数のドメインのテキストから要約を各々生成する場合の訓練事例の作成に要するコストを削減する。【解決手段】第1記憶部14に記憶された訓練事例データベース12には、テキストxiとテキストxiから予め生成された要約yiとを対応付けた複数のドメインの訓練事例が各々格納され、パラメタ推定部16は、ドメインの数をd、個々のドメインの個々の特徴ベクトルf(x,y)の次元数をnとしたときに次元数がn×(d+1)次元で、最初のn次元は全てのドメインで前記特徴ベクトルが要素として設定され、以降のn次元ずつのd組の要素は各組毎に異なるドメインのみ前記特徴ベクトルが要素として設定され、他のドメインは同じ組の要素の値に全て0が設定された、拡張された特徴ベクトルを用いてパラメタを学習し、パラメタデータベース18に格納する。格納されたパラメタは、テキスト要約部24による要約対象のテキストxからの要約yの生成に用いられる。【選択図】図1
請求項(抜粋):
特定のドメインに属するテキストと、当該テキストから予め生成された要約と、を対応付けた特定のドメインの訓練事例を複数のドメインについて各々格納した訓練事例データベースを記憶する第1記憶部と、 要約対象のテキストからの要約の生成に用いるパラメタを、個々のドメインの訓練事例から構築される個々の特徴ベクトルの次元数をn、ドメインの数をdとしたときの次元数がn(d+1)で、最初のn次元の要素がドメインに拘わらず前記特徴ベクトルの値とされ、以降のn次元ずつのd組の要素については、ドメイン毎に異なる組の要素が前記特徴ベクトルの値とされ、残余の要素の値が0とされた、拡張した特徴ベクトルに基づいて推定するパラメタ推定部と、 を含むテキスト要約装置。
IPC (1件):
G06F 17/30
FI (2件):
G06F17/30 220A ,  G06F17/30 170A
引用特許:
出願人引用 (2件) 審査官引用 (2件)
引用文献:
出願人引用 (2件) 審査官引用 (2件)

前のページに戻る