文献
J-GLOBAL ID:202202276520145966   整理番号:22A1100166

項クラスタ重みづけとピラーK平均クラスタリングを用いたニュースグループトピック抽出【JST・京大機械翻訳】

Newsgroup topic extraction using term-cluster weighting and Pillar K-Means clustering
著者 (3件):
資料名:
巻: 44  号:ページ: 357-364  発行年: 2022年 
JST資料番号: T0481A  ISSN: 1206-212X  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
トピック抽出は,膨大な量の情報源から情報を収集するのを助けるための不可欠なツールである。本論文では,テキスト文書の収集から話題を抽出するための新しいアプローチを紹介した。話題を得るために,文書の不要な部分を除去するために前処理段階を行った。次に,用語周波数逆文書周波数を文書の重み項に築き上げた。その後,SVDベースの特徴変換が,クラスタリングのために使用された建築特徴に含まれている。クラスタリングプロセスの前に,Pillarアルゴリズムを実行して,K-平均クラスタ化のための初期重心を選択した。最後に,クラスタにおける用語の重みを,クラスタから話題を選ぶための基底として,項クラスタ重みを用いて計算した。実験結果に基づき,このフレームワークは,20Newsグループデータセットの二値2,マルチ5,マルチ7,およびマルチ10カテゴリから得られた4つのトピックスに対して,100%,95.1%,83,7%,および68.7%の精度を達成することによって,満足のいく結果を達成すると結論づけられた。Please refer to the publisher for the copyright holders. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  情報検索一般 

前のページに戻る