特許
J-GLOBAL ID:201303093580944511

話題抽出装置及び話題抽出方法

発明者:
出願人/特許権者:
代理人 (4件): 長谷川 芳樹 ,  黒木 義樹 ,  沖山 隆 ,  深石 賢治
公報種別:公開公報
出願番号(国際出願番号):特願2012-097703
公開番号(公開出願番号):特開2013-225244
出願日: 2012年04月23日
公開日(公表日): 2013年10月31日
要約:
【課題】 テキストデータを対象に瞬間的な盛り上がりだけでなく継続的に盛り上がっている話題に関しては継続的かつリアルタイムに盛り上がっている話題を抽出する。【解決手段】 話題抽出装置10は、複数の文書から話題を示す単語を抽出する構文解析部13と、単語が盛り上がりを判定する対象期間から遡った判断期間に新規に盛り上がった話題を示す単語として判定されたか否かを判断して、当該判断に応じた基準期間を設定して、対象期間及び基準期間での単語の出現頻度をカウントする盛り上がり値生成部16と、当該出現頻度に基づいて単語が盛り上がった話題を示す単語であるか否かを判定するグルーピング部18とを備える。【選択図】 図1
請求項(抜粋):
時刻に対応付けられた複数のテキストデータを取得するテキスト取得手段と、 前記テキスト取得手段によって取得されたテキストデータから、話題を示す文字列を抽出する文字列抽出手段と、 前記文字列抽出手段によって抽出された文字列が、盛り上がりを判定する時間枠から予め設定された時間遡った時刻までの判断期間に新規に盛り上がった話題を示す文字列として判定されたか否かを判断する判断手段と、 前記判断手段によって、前記文字列が新規に盛り上がった話題を示す文字列として判定されなかったものと判断された場合には、前記テキストデータに対応付けられた時刻を参照して、前記時間枠での前記複数のテキストデータにおける当該文字列の出現頻度と前記時間枠から予め設定された時間遡った時刻までの参照期間での当該文字列の出現頻度とに基づいて、当該時間枠において当該文字列が新規に盛り上がった話題を示す文字列であるか否かを判定すると共に、前記判断手段によって、当該文字列が新規に盛り上がった話題を示す文字列として判定されたものと判断された場合には、前記テキストデータに対応付けられた時刻を参照して、前記時間枠での前記複数のテキストデータにおける当該文字列の出現頻度と当該文字列が新規に盛り上がった話題を示す文字列として判定された際の前記参照期間での当該文字列の出現頻度とに基づいて、当該時間枠において当該文字列が新規ではなく盛り上がった話題を示す文字列であるか否かを判定する盛り上がり判定手段と、 を備える話題抽出装置。
IPC (1件):
G06F 17/30
FI (1件):
G06F17/30 220Z
引用特許:
審査官引用 (2件)
引用文献:
前のページに戻る