文献
J-GLOBAL ID:201802238423161985   整理番号:18A0107347

特徴空間に基づくテキストクラスタリング【JST・京大機械翻訳】

Text Clustering Based on Feature Space
著者 (4件):
資料名:
巻: 27  号:ページ: 75-77,81  発行年: 2017年 
JST資料番号: C3602A  ISSN: 1673-629X  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 中国 (CHN)  言語: 中国語 (ZH)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
テキストクラスタリングはクラスタリングアルゴリズムの具体的な応用であり、インターネットの発展に伴い、テキストクラスタリングの応用はますます広くなり、例えば情報検索、知能検索エンジンなどの方面で広く応用されている。テキストクラスタリングアルゴリズムは主にテキスト前処理とテキストクラスタリングアルゴリズムに関連しているため、テキストクラスタリングに対する改良はこの二つの方面から着手することができる。伝統的なテキストクラスタリングのテキスト前処理はVSMモデルを採用し、このモデルは語と語の意味類似度と語と語の関連性を考慮せず、テキストクラスタリングの精度が非常に低い。この問題を解決するために,特徴空間のテキストクラスタリングに基づく新しい方法を提案した。この方法は,文書集合の特徴空間に従って,代替辞書を構築し,それにより文書の主題を得て,主題に従って対応するドメイン辞書を用いて,文書に対応する置換を行う。伝統的なテキストクラスタリングはK平均アルゴリズムを使用するが,このアルゴリズムでは,Kの値を人工的に指定する必要がある。この問題を解決するために,K値最適化に基づくK平均改良アルゴリズムを提案した。実験結果は,提案したテキストクラスタリングアルゴリズムとK平均改良アルゴリズムが,テキストクラスタリングの知能と精度を著しく向上させることを示した。Data from Wanfang. Translated by JST【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
著者キーワード (6件):
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
システム・制御理論一般  ,  人工知能  ,  自然語処理 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る