特許
J-GLOBAL ID:200903004195518328

トピック可視化装置、トピック可視化方法、トピック可視化プログラムおよびそのプログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 磯野 道造 ,  大石 恵
公報種別:公開公報
出願番号(国際出願番号):特願2008-124169
公開番号(公開出願番号):特開2009-271874
出願日: 2008年05月12日
公開日(公表日): 2009年11月19日
要約:
【課題】データ集合を可視化した際に最適なトピックモデルを基に、そのデータ集合を可視化する技術を提供する。【解決手段】トピック可視化装置は、文書座標集合47、トピック座標集合48、単語出現確率集合49から帰属度を推定し記憶手段に格納する帰属度推定部21と、帰属度集合46、文書座標集合47、トピック座標集合48、単語出現確率集合49から文書座標集合47とトピック座標集合48とを推定し記憶手段に格納する配置部22と、入力データ45として文書集合を受け付けて単語出現確率集合49を推定し記憶手段に格納するトピックモデル推定部23と、帰属度の推定、文書座標集合47とトピック座標集合48との推定、単語出現確率集合49の推定の一連の処理を繰り返し、文書集合に対して文書座標集合47、トピック座標集合48、単語出現確率集合49が最適化した場合に文書座標集合47を出力する可視化部24とを備える。【選択図】図2
請求項(抜粋):
意味が付与された記号単位から成る系列を内容として含むデータであって前記記号単位を離散値のベクトルとして表現することが可能なデータを、前記データの集合において予め定められた複数のトピックのうち前記データに内在するトピックと共に、予め定められた空間において可視化するトピック可視化装置において、 可視化対象とする前記データの集合、前記空間において前記データの位置を示すデータ座標の集合、前記空間においてトピックの位置を示すトピック座標の集合、前記データのトピックにおいて前記データ座標の集合で扱う各記号単位が前記トピックにおいて出現する確率であるトピックモデルの集合、および、前記データのトピックにおいて前記データ座標の集合で扱う各記号単位が前記予め定められた複数のトピックのうちどのトピックに帰属するかを表す帰属度の集合を記憶した記憶手段と、 前記記憶手段に記憶されている、前記データ座標の集合、前記トピック座標の集合および前記トピックモデルの集合について入力をそれぞれ受け付け、前記帰属度を推定し、前記記憶手段に更新して格納する帰属度推定処理手段と、 前記記憶手段に記憶されている、前記帰属度の集合、前記データ座標の集合、前記トピック座標の集合および前記トピックモデルの集合について入力を受け付け、前記入力として受け付けた各集合に対して前記データ座標の集合および前記トピック座標の集合を最適化させるために予め定められた目的関数により、前記データ座標の集合および前記トピック座標の集合を推定し、前記記憶手段に更新して格納する配置処理手段と、 前記記憶手段に記憶されている、可視化対象とする前記データの集合について入力を受け付け、前記受け付けた前記データの集合により、前記トピックモデルの集合を推定し、前記記憶手段に更新して格納するトピックモデル推定処理手段と、 前記帰属度を推定する処理と、前記データ座標の集合および前記トピック座標の集合を推定する処理と、前記トピックモデルの集合を推定する処理との一連の処理を繰り返すことで、前記データの集合に対して、前記データ座標の集合、前記トピック座標の集合および前記トピックモデルの集合が最適化した場合に、前記記憶手段に記憶されている前記データ座標の集合を出力する可視化処理手段と、 を備えることを特徴とするトピック可視化装置。
IPC (1件):
G06F 17/30
FI (3件):
G06F17/30 220Z ,  G06F17/30 170A ,  G06F17/30 360Z
Fターム (3件):
5B075ND03 ,  5B075NS10 ,  5B075PQ13
引用文献:
前のページに戻る