特許
J-GLOBAL ID:201003050711342501

データ解析装置、データ解析プログラムおよびその記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 磯野 道造 ,  大石 恵
公報種別:公開公報
出願番号(国際出願番号):特願2009-091556
公開番号(公開出願番号):特開2010-244264
出願日: 2009年04月03日
公開日(公表日): 2010年10月28日
要約:
【課題】異なる時間スケールで変化する特徴量を考慮して、時系列データ集合を解析することを課題とする。【解決手段】本発明は、構成要素が離散値のベクトルとして表現されたデータを時系列に複数集めた時系列データ集合を、前記構成要素それぞれに対して推定される分類項目である複数のトピックと、前記トピックの推定に関する確率モデルと、に基づいて解析するデータ解析装置1である。演算手段3は、複数の異なる時間スケールそれぞれに関して所定のトピックを伴った所定の構成要素が生成する確率の集合である多重スケール確率集合424等を用いて演算することで、構成要素に付与するトピックを推定する。【選択図】図1
請求項(抜粋):
構成要素が離散値のベクトルとして表現されたデータを時系列に複数集めた時系列データ集合を、前記構成要素それぞれに対して推定される分類項目である複数のトピックと、前記トピックの推定に関する確率モデルと、に基づいて解析するデータ解析装置であって、 前記データを入力する入力手段と、 前記時系列データ集合、 前記データにおける構成要素それぞれに対して推定されたトピックが時刻毎に集められた帰属トピック集合、 前記確率モデルにおけるパラメータが時刻毎に集められたパラメータ集合、 複数の異なる時間スケールそれぞれに関して所定のトピックを伴った所定の構成要素が生成する確率の集合である多重スケール確率集合、および、 前記帰属トピック集合と前記パラメータ集合とが前記時系列データ集合を尤もらしく表している度合いである尤度を前記多重スケール確率集合に基づいて最大化するための目的関数、を記憶する記憶手段と、 前記確率モデルに基づく演算を前記時刻単位で行う演算手段と、 演算結果を出力する出力手段と、を備え、 前記演算手段は、 前記帰属トピック集合に関して、所定時刻における前記入力されたデータの構成要素それぞれに対してランダムにトピックを推定することで初期化を行う初期化部と、 前記帰属トピック集合と前記パラメータ集合との更新処理を、前記目的関数が収束するまで繰り返す繰り返し制御部と、 前記多重スケール確率集合を更新する多重スケール確率推定部と、を有し 前記繰り返し制御部は、 前記パラメータ集合と前記多重スケール確率集合とを用いて、前記所定時刻における入力データの構成要素それぞれに対して推定されているトピックを推定し直すことで、前記帰属トピック集合を更新する帰属トピック推定部と、 前記パラメータ集合と前記多重スケール確率集合とを用いて、前記パラメータ集合におけるパラメータのうち少なくとも一部を推定し直すことで、前記パラメータ集合を更新するパラメータ推定部と、を備え、 前記多重スケール確率推定部は、 所定の時間スケールに関して所定のトピックを伴った所定の構成要素が生成する確率は、前記所定時刻よりも前記所定の時間スケール分だけ前の時刻から前記所定時刻までの時間帯において前記所定のトピックを伴った前記所定の構成要素が生成する確率であるという定義に基づき、前記確率モデルと、前記パラメータ集合と、前記多重スケール確率集合とを用いて、所定時刻の次の時刻の多重スケール確率集合を推定することで前記多重スケール確率集合を更新する ことを特徴とするデータ解析装置。
IPC (1件):
G06F 17/30
FI (2件):
G06F17/30 220Z ,  G06F17/30 170A
Fターム (2件):
5B075ND03 ,  5B075NS10

前のページに戻る