抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿において,我々は,[1],[2],[3]において作られてきた文字列の集合上の確率論を用いて,文字列データに対する混合モデルとEMアルゴリズムの理論を展開することにより,文字列データの教師無しクラスタリングの問題に取り組む。我々は,まず,実数の集合上のLaplace分布をモチーフにして作られたパラメトリックな分布を文字列の集合上に導入し,その基本的な性質を調べる。このLaplace様分布は,位置を表す文字列のパラメーターと散らばりを表す正の実数のパラメーターを持つが,一方のパラメーターが文字列であるため,最尤推定量を陽に書くのが難しい。そこで,我々は,観測文字列の数が増加するに従って,最尤推定量に概収束する推定量を構成し,更にそれらによってパラメーターが強一致推定されることを示す。その後,我々は,Laplace様分布の混合モデルのパラメーターを推定するための反復アルゴリズムを構成し,観測文字列の数とアルゴリズムの反復回数が増加するに従って,そのアルゴリズムがEMアルゴリズムに概収束すること,またそれによりLaplace様混合モデルのパラメーターが強一致推定されることを証明する。我々は,最後に,このLaplace様混合モデルから文字列の教師無しクラスタリング方式を導出し,それが正しい分類を行う事後確率が最大であるという意味で漸近的に最適であることを述べる。(著者抄録)