抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
AprioriとFP-Grorentアルゴリズムは頻繁なパターンマイニングにおける古典的なアルゴリズムであり、Aprioriにはより多くの欠陥があるため、FP-Growthはシングルコンピュータの計算環境において比較的効率的なアルゴリズムである。しかしながら,大規模なデータの時代における非並列計算のボトルネックに対して,本論文は,トランザクションにおけるアイテム間の重みづけマトリックスに基づく負荷バランスのための頻繁なパターン成長アルゴリズム(CWBPFP)を提案した。このアルゴリズムでは,Sparkフレームワークにおいて並列計算を実現し,データパケットにおいて負荷バランス戦略を利用し,パケットに格納されているデータは,対応する頻繁なコードの符号化によって構成される。各ノードにおいて,各データにおける1つの事象における結合情報を,3つの連結した重み行列に格納し,制約部分木を用いて,各々の作業ノードが頻繁なパターンをマイニングするときの条件FP-ツリーの速度を加速した。再結合重み行列を用いて,頻繁にパターンをマイニングするときの条件パターンベースの第一走査を避けた。結合した重み行列と制約された部分木の結合は,各々の作業ノードのFP-ツリーマイニングプロセスに適用されるので,並列マイニングFP-ツリーの性能を向上させることができる。実験により,提案した並列アルゴリズムは,大きなデータに対して高い性能と拡張性を有することを示した。Data from Wanfang. Translated by JST【JST・京大機械翻訳】