抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
文書クラスタリングとトピックモデリングは,テキストマイニングにおける基本的タスクであり,相互に強化するために統一することができる。本論文では,両タスクの共同モデリングと相互依存充足に対する機械学習手法を提案した。特に,文書クラスタ化とトピックモデリングは,テキストコーパスにおけるクラスタ,トピック,およびコンテンツの革新的Bayes生成モデルの下でシームレスに相互関係がある。そのようなモデルは,テキストコーパスが生成過程から生じると仮定し,そこではクラスタと話題が連結潜在因子として作用する。基本的に,クラスタは最初に記述的で活性なトピック分布と関連し,クラスタコヒーレンスを強制する。次に,個々の文書を1つのそれぞれのクラスタに割り当てて,それに応じて悪化させた。考案されたモデルの下で,文書クラスタ化とトピックモデリングは,Bayes推論によって単純に相互依存的方法で同時に実行されることができる。この目的のために,崩壊Gibbsサンプリングとパラメータ推定に関する数学的詳細を導出し,近似推論アルゴリズムに実装した。標準ベンチマークテキストコーパスに関する比較実験により,テキスト文書の共同クラスタリングにおける本手法の有効性を明らかにし,コヒーレントトピックに関する意味論を明らかにした。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】