抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
頻出パターン/系列パターンを説明変数とする分類予測モデルとしてCAEP/CAESP(Classification by Aggregating Emerging (Sequential) Patterns)が提案されている。本論文では,頻出パターンマイニングについて概説し,CAEP/CAESPを実現するために開発された離散構造データのデータマイニングツールigvminerについて述べた。igvminerはデータマイニング基盤ソフトウェアとして,1)ゼロサブプレス型BDD(Binary Decision Diagram),2)頻出パターン列挙プログラムLCM及びLCM-seq,3)CSV(Comma Separated Value)データの効率的処理プログラムKGMODをスクリプト言語から直接利用できるようにラッピングしている。また,ruby拡張ライブラリを用い,i)顕在(系列)パターンの列挙,ii)タクソノミーの扱い,iii)系列ウィンドウ幅の設定,iv)アイテム間のギャップ長制約の設定,v)顕在(系列)パターンを使った分類モデルの構築を特徴とする頻出(系列)パターン列挙用応用ソフトウェアigvcaep/igvcaespを開発した。実際にPOS(Point of Sales)データを用いた特定顧客層の特徴分析,及び日常消費品のブランドスイッチ予測への適用事例を示した。