文献
J-GLOBAL ID:201502221040352410   整理番号:15A1116969

大量ショートテキストに対する高速話題検出と評価【Powered by NICT】

Fast topic detection and evaluation towards massive short texts
著者 (4件):
資料名:
巻: 32  号:ページ: 717-722,739  発行年: 2015年 
JST資料番号: C2536A  ISSN: 1001-3695  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 中国 (CHN)  言語: 中国語 (ZH)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
最も話題検出法は主に長いテキストとニュースデータセットに焦点を当てた。大量ショートテキストにおけるいくつかの重要な特性を持ち,スパース,非構造と非常に雑音など。伝統的話題検出法である話題を効果的に発見することは困難である。本論文では,新しい方法,重み付きGNアルゴリズム(CWワゴン)を持つ単語共起を合併したを示した。CWワゴン話題を迅速に検出するために使用することができた。CWワゴン法のプロセスを詳細に記述しかつ特異的に実装されたアルゴリズムを与えた。二データセットをsina簡易ブログと主要なニュースウェブサイトから収集した。比較法としてのLDAとK平均法を使用し,包括的な実験を行った。実験結果は,CWワゴンはK-平均法とLDAよりも正確な話題の20%以上を発見できることを示す,話題の純度は高かった。添加では,CWワゴンの走行時間が最小,CWワゴンは実際の多くの短いテキストからの話題を効率的に検出できることを意味する。Data from the ScienceChina, LCAS. Translated by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
計算機網 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る