文書クラスタリングとトピックモデリング:統一Bayes確率論的展望【JST・京大機械翻訳】

Costa Gianni; Ortale Riccardo

文献

J-GLOBAL ID：202002279127404832 整理番号：20A0909809

文書クラスタリングとトピックモデリング:統一Bayes確率論的展望【JST・京大機械翻訳】

Document Clustering and Topic Modeling: A Unified Bayesian Probabilistic Perspective

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=20A0909809&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=20A0909809&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (2件)： ,
資料名：
巻： 2019 号： ICTAI ページ： 278-285 発行年： 2019年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

文書クラスタリングとトピックモデリングは,テキストマイニングにおける基本的タスクであり,相互に強化するために統一することができる。本論文では,両タスクの共同モデリングと相互依存充足に対する機械学習手法を提案した。特に,文書クラスタ化とトピックモデリングは,テキストコーパスにおけるクラスタ,トピック,およびコンテンツの革新的Bayes生成モデルの下でシームレスに相互関係がある。そのようなモデルは,テキストコーパスが生成過程から生じると仮定し,そこではクラスタと話題が連結潜在因子として作用する。基本的に,クラスタは最初に記述的で活性なトピック分布と関連し,クラスタコヒーレンスを強制する。次に,個々の文書を1つのそれぞれのクラスタに割り当てて,それに応じて悪化させた。考案されたモデルの下で,文書クラスタ化とトピックモデリングは,Bayes推論によって単純に相互依存的方法で同時に実行されることができる。この目的のために,崩壊Gibbsサンプリングとパラメータ推定に関する数学的詳細を導出し,近似推論アルゴリズムに実装した。標準ベンチマークテキストコーパスに関する比較実験により,テキスト文書の共同クラスタリングにおける本手法の有効性を明らかにし,コヒーレントトピックに関する意味論を明らかにした。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , 【Automatic Indexing@JST】

図形・画像処理一般

, , , ,

前のページに戻る