文献
J-GLOBAL ID:201802248660142948   整理番号:18A1082458

頻出語集合に基づく新文書クラスタリング手法【JST・京大機械翻訳】

A New Documents Clustering Method Based on Frequent Itemsets
著者 (2件):
資料名:
巻: 55  号:ページ: 102-112  発行年: 2018年 
JST資料番号: W0790A  ISSN: 1000-1239  CODEN: JYYFEY  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 中国 (CHN)  言語: 中国語 (ZH)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
伝統的テキストクラスタリング法は,単語の重要度のみを考慮して,単語と語の間の意味関係を無視するために,単語ベースのテキスト表現モデルを使用する。同時に,従来のテキスト表現モデルには高次元の問題がある。上記の問題を解決する。頻出語集合に基づくテキストクラスタリング法(frequentitemsetsbaseddocumentclusteringmethod)を提案した。FP-Growthアルゴリズムを使用して頻出語集合をマイニングし,文書の次元を頻出語集合によって表現し,テキストの類似性に従ってテキストネットワークを構築した。FICアルゴリズムは,テキスト表現の次元を減少するだけでなく,文書集合の文書の関係も構築できるだけでなく,テキストとテキスト間の独立な関係も持たない。実験には,2つの英語コーパスReuters-21578,20NewsGroup,および1つの中国語コーパス-検索のニュースデータセットを用いて,アルゴリズムの精度を試験した。実験結果を示した。Data from Wanfang. Translated by JST【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る