文字列の集合上のLaplace様混合モデルとEMアルゴリズムに基づく文字列クラスタリング

小谷野仁; 林田守広; 阿久津達也

文献

J-GLOBAL ID：201502220027307965 整理番号：15A0937301

文字列の集合上のLaplace様混合モデルとEMアルゴリズムに基づく文字列クラスタリング

String Clustering Based on a Laplace-like Mixture and EM Algorithm on a Set of Strings

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=15A0937301&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=15A0937301&from=J-GLOBAL&jstjournalNo=S0532B") }}

著者 (3件)： , ,
資料名：
巻： 115 号： 112(IBISML2015 1-26) ページ： 131-136 発行年： 2015年06月16日
JST資料番号： S0532B ISSN： 0913-5685 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

本稿において,我々は,[1],[2],[3]において作られてきた文字列の集合上の確率論を用いて,文字列データに対する混合モデルとEMアルゴリズムの理論を展開することにより,文字列データの教師無しクラスタリングの問題に取り組む。我々は,まず,実数の集合上のLaplace分布をモチーフにして作られたパラメトリックな分布を文字列の集合上に導入し,その基本的な性質を調べる。このLaplace様分布は,位置を表す文字列のパラメーターと散らばりを表す正の実数のパラメーターを持つが,一方のパラメーターが文字列であるため,最尤推定量を陽に書くのが難しい。そこで,我々は,観測文字列の数が増加するに従って,最尤推定量に概収束する推定量を構成し,更にそれらによってパラメーターが強一致推定されることを示す。その後,我々は,Laplace様分布の混合モデルのパラメーターを推定するための反復アルゴリズムを構成し,観測文字列の数とアルゴリズムの反復回数が増加するに従って,そのアルゴリズムがEMアルゴリズムに概収束すること,またそれによりLaplace様混合モデルのパラメーターが強一致推定されることを証明する。我々は,最後に,このLaplace様混合モデルから文字列の教師無しクラスタリング方式を導出し,それが正しい分類を行う事後確率が最大であるという意味で漸近的に最適であることを述べる。(著者抄録)

, , , , , , , , ,
, , , ,

人工知能 , 記号処理 , 統計学 , 確率論

引用文献 (6件)：

Koyano, H., Hayashida, M. and Akutsu, T.: Maximum margin classifier working in a set of strings. arXiv:1406.0597v2.
Koyano, H. and Kishino, H.: Quantifying biodiversity and asymptotics for a sequence of random strings, Physical Review E, Vol. 81, No. 6, p. 061912 (2010).
Koyano, H., Tsubouchi, T., Kishino, H. and Akutsu, T.: Archaeal β diversity patterns under the seafloor along geochemical gradients, Journal of Geophysical Research G (Biogeosciences), Vol. 119, No. 9, pp. 1770-1788 (2014).
Olivares-Rodríguez, C. and Oncina, J.: A stochastic approach to median string computation, Structural, Syntactic, and Statistical Pattern Recognition (da Vitoria Lobo, N., Kasparis, T., Roli, F. Kwok, J. T., Georgiopoulos, M., Anagnostopoulos, G. C. and Loog, M., eds.), Springer, Berlin, pp. 431-440 (2008).
Perlman, M. D.: On the strong consistency of approximate maximum likelihood estimators, Proceedings of the Sixth Berkeley Symposium on Mathematical Statistics and Probability (Le Cam, L. M., Neyman, J. and Scott, E. L., eds.), Vol. 1, Berkeley, CA, University of California Press, pp. 263-281 (1972).

, , , ,

前のページに戻る