特許
J-GLOBAL ID:201303091236257324

トピック可視化装置、トピック可視化方法、トピック可視化プログラムおよびそのプログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (3件): 磯野 道造 ,  大石 恵 ,  中村 新二
公報種別:特許公報
出願番号(国際出願番号):特願2008-124169
公開番号(公開出願番号):特開2009-271874
特許番号:特許第5081059号
出願日: 2008年05月12日
公開日(公表日): 2009年11月19日
請求項(抜粋):
【請求項1】 意味が付与された記号単位から成る系列を内容として含むデータであって前記記号単位を離散値のベクトルとして表現することが可能なデータを、予め定められた空間において類似するデータが近くに配置されるように可視化するための各データの配置を求めるトピック可視化装置において、 前記予め定められた空間における第n番目(1≦n≦N、Nはデータの総数)のデータwnの位置であるデータ座標xnの初期値と、前記予め定められた空間における第z番目(1≦z≦Z、Zはトピックの総数)のトピックzの位置であるトピック座標φzの初期値と、各トピックzにおいて前記データwnに含まれるm番目(1≦m≦Mn、Mnはデータwnで扱う記号単位の総数)の記号単位wnmが出現する単語出現確率θzwnmの初期値を設定する初期化手段と、 前記データ座標xnの集合Xと前記トピック座標φzの集合Φと前記単語出現確率θzwnmの集合Θとがどのくらい前記各データwnをもっともらしく説明できているかを表す、予め定められた第1の尤度が最大となるように、前記データ座標xnと前記トピック座標φzとを更新する配置処理手段と、 前記更新後のデータ座標xnと前記更新後のトピック座標φzとを用いて前記単語出現確率θzwnmを更新し、前記更新後のデータ座標xnと前記更新後のトピック座標φzと前記更新後の単語出現確率θzwnmとを用いて計算される前記第1の尤度が所定の収束条件を満たさない場合には、前記配置処理手段による処理を繰り返し実行させ、前記第1の尤度が前記収束条件を満たす場合に、前記更新後のデータ座標xnの集合を出力するトピックモデル推定処理手段と、 を備えることを特徴とするトピック可視化装置。
IPC (1件):
G06F 17/30 ( 200 6.01)
FI (3件):
G06F 17/30 220 Z ,  G06F 17/30 170 A ,  G06F 17/30 360 Z
引用文献:
前のページに戻る