文献
J-GLOBAL ID:201802276038148072   整理番号:18A1650821

スパーク上のマイクロブログのための効果的なホットトピック検出法【JST・京大機械翻訳】

An effective hot topic detection method for microblog on spark
著者 (4件):
資料名:
巻: 70  ページ: 1010-1023  発行年: 2018年 
JST資料番号: W2175A  ISSN: 1568-4946  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
大きいデータ時代の出現により,膨大な量のデジタル化されたテキスト材料からの価値あるホットな話題を迅速かつ正確に得る方法が注目されている。本研究では,大規模データ環境におけるマイクロブログにおけるトピック検出に焦点を当てた。既存の手法とは異なり,分散した方法でこの問題を解決した。具体的には,並列二相micmacホットトピック検出(TMHTD)と呼ばれる非反復アルゴリズムを提案し,それをApache公園環境に実装した。提案したTMHTD法は,2つの相,すなわち,マイクロクラスタリングフェーズとマクロクラスタリングフェーズを含む。ホットトピック検出の精度を改善するために,3つの最適化方法を提案した。大規模データベースを扱うために,高度にスケーラブルな方法でホットトピック検出を具体的に達成するためにMapReduceジョブのグループを意図的に設計した。著者らは,一般的な単一経路アルゴリズムおよび潜在的Dirichlet配置(LDA)アルゴリズムとTMHTDアルゴリズムを比較した。著者らの実験は,Sina Weibo APIから集められた実生活データセットについて行われた。広範な実験結果は,TMHTDアルゴリズムの精度と性能が以前の方法よりも著しい改善であることを示した。より具体的には,TMHTDアルゴリズムのF測度値は,一般的な単一パスアルゴリズムとLDAアルゴリズムよりもそれぞれ6%と8%の改善を示した。TMHTDアルゴリズムの実行時間は,一般的な単一パスアルゴリズムとLDAアルゴリズムよりもそれぞれ7倍と2倍優れている。Copyright 2018 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  その他の情報処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る