Sparkフレームワークに基づく並列FP-Groマイニングアルゴリズムを提案した。【JST・京大機械翻訳】

Zhang Wen; Luo Ke

文献

J-GLOBAL ID：201702281270344200 整理番号：17A1983293

Sparkフレームワークに基づく並列FP-Groマイニングアルゴリズムを提案した。【JST・京大機械翻訳】

A parallel FP-Growth mining algorithm based on Spark framework

出版者サイト複写サービスで全文入手
高度な検索・分析はJDreamⅢで

著者 (2件)： ,
資料名：
巻： 39 号： 8 ページ： 1403-1409 発行年： 2017年
JST資料番号： C2938A ISSN： 1007-130X 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：中国 (CHN) 言語：中国語 (ZH)

AprioriとFP-Grorentアルゴリズムは頻繁なパターンマイニングにおける古典的なアルゴリズムであり、Aprioriにはより多くの欠陥があるため、FP-Growthはシングルコンピュータの計算環境において比較的効率的なアルゴリズムである。しかしながら,大規模なデータの時代における非並列計算のボトルネックに対して,本論文は,トランザクションにおけるアイテム間の重みづけマトリックスに基づく負荷バランスのための頻繁なパターン成長アルゴリズム(CWBPFP)を提案した。このアルゴリズムでは,Sparkフレームワークにおいて並列計算を実現し,データパケットにおいて負荷バランス戦略を利用し,パケットに格納されているデータは,対応する頻繁なコードの符号化によって構成される。各ノードにおいて,各データにおける1つの事象における結合情報を,3つの連結した重み行列に格納し,制約部分木を用いて,各々の作業ノードが頻繁なパターンをマイニングするときの条件FP-ツリーの速度を加速した。再結合重み行列を用いて,頻繁にパターンをマイニングするときの条件パターンベースの第一走査を避けた。結合した重み行列と制約された部分木の結合は,各々の作業ノードのFP-ツリーマイニングプロセスに適用されるので,並列マイニングFP-ツリーの性能を向上させることができる。実験により,提案した並列アルゴリズムは,大きなデータに対して高い性能と拡張性を有することを示した。Data from Wanfang. Translated by JST【JST・京大機械翻訳】

, , , , , , ,
, , 【Automatic Indexing@JST】

著者キーワード (6件)： , , , , ,

データベースシステム , 人工知能

, ,

前のページに戻る