特許
J-GLOBAL ID:201503095467533073

トレンド分析装置、トレンド分析方法およびトレンド分析プログラム

発明者:
出願人/特許権者:
代理人 (4件): 小林 博通 ,  鵜澤 英久 ,  山口 幸二 ,  橋本 剛
公報種別:公開公報
出願番号(国際出願番号):特願2013-236961
公開番号(公開出願番号):特開2015-097026
出願日: 2013年11月15日
公開日(公表日): 2015年05月21日
要約:
【課題】ユーザの特定の興味と近いトレンドを分析することができるトレンド分析装置を提供する。【解決手段】テキスト関連グラフ計算部30にてテキスト群の関連を表すグラフを構築し、クエリベースクラスタ抽出部40にて特定の興味に応じたクエリに基づいて前記構築したグラフをクラスタリングし、クエリと意味の近いテキストをまとめる。そのテキスト群を、サブクラスタ抽出部70がさらにクラスタリングし、その結果を用いて、トレンドトピック計算部120がユーザの特定の興味と近いトレンドトピック計算する。さらに、クラスタ類似度計算部90にて計算した、クエリと関連度が高く且つサブクラスタと関連度の低いテキストを再クラスタリングするか否かを判定し、判定結果に応じてサブクラス抽出部80がクラスタを再計算する。【選択図】図1
請求項(抜粋):
テキストストリームにおけるトレンドを分析するトレンド分析装置であって、 テキストストリームが格納されたテキストストリーム記憶手段と、 前記テキストストリーム記憶手段に格納された各テキストをノードとし、各テキスト中に共通の単語が共起しているものをエッジとしたテキスト関連グラフを構築するテキスト関連グラフ計算手段と、 ユーザが指定したクエリ集合を入力とし、前記テキスト関連グラフ計算手段により構築されたテキスト関連グラフから、前記入力されたクエリ集合を含むテキストのノードを起点としてクエリに関連するテキストクラスタを抽出してクエリベースクラスタ記憶手段に格納するクエリベースクラスタ抽出手段と、 前記クエリベースクラスタ記憶手段に格納されたテキスト群の各テキストの特徴量と、取り込んだテキストストリームの各テキストの特徴量とを計算する特徴量抽出手段と、 前記特徴量抽出手段によって計算された、クエリベースクラスタ記憶手段に格納されたテキスト群のテキスト特徴量とユーザが入力したトレンド数とを用いてクラスタリングしサブクラスタを抽出する処理と、前記特徴量抽出手段によって計算されたテキストストリームのテキスト特徴量と前記抽出されたサブクラスタとの類似度に基づいて求められた、クエリと関連度が高く且つ前記サブクラスタと関連度の低いテキストであって、再クラスタリングを行うと判定したテキスト群と、ユーザが入力したトレンド数とを用いてクラスタリングを行う処理とを実行し、前記各クラスタリングにより抽出されたサブクラスタをサブクラスタ記憶手段に格納するサブクラスタ抽出手段と、 前記特徴量抽出手段によって計算されたテキストストリームのテキスト特徴量およびテキスト情報と、前記サブクラスタ記憶手段に格納されたクラスタ群とを入力とし、テキストと各サブクラスタの類似度と、テキストと全てのサブクラスタの類似度とを計算し、クエリと関連度が高く且つサブクラスタと関連度の低いテキストを非関連テキスト記憶手段に格納するクラスタ類似度計算手段と、 前記非関連テキスト記憶手段内に格納されたテキスト数がしきい値より大のときに再クラスタリングを行うと判定する再クラスタリング判定手段と、 前記サブクラスタ記憶手段に格納されたクラスタ群について、単語の集合であり、各単語はトレンドの度合を数値として保持しているトレンドトピックを計算するトレンドトピック計算手段と、 を備えたことを特徴とするトレンド分析装置。
IPC (1件):
G06F 17/30
FI (3件):
G06F17/30 210D ,  G06F17/30 170A ,  G06F17/30 350C
引用特許:
出願人引用 (1件)

前のページに戻る