文献
J-GLOBAL ID:201202216972222089   整理番号:12A0456336

「系列パターンマイニングの最近の動向」テキスト系列マイニングにおける有用性尺度について

著者 (1件):
資料名:
巻: 27  号:ページ: 136-145  発行年: 2012年03月01日 
JST資料番号: X0330A  ISSN: 0912-8085  資料種別: 逐次刊行物 (A)
記事区分: 解説  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
単一のアイテム集合系列からなるデータベース中の部分系列の出現頻度は自明な概念ではなく,1)スライド窓頻度,2)系列先頭頻度,3)系列全体頻度などが提案されている。本論文では,系列の評価基準として情報量と出現頻度を同時に用いるYangらの先行研究を概説し,新聞記事コーパスへの適用を念頭に置いてより合理的で有用な尺度について述べた。まず,1)で用いるスライド窓機構によって非周期系列パターンを抽出する方法を示し,基本出現頻度をもとに単純頻度,対数頻度,対数化相対頻度といった重み付き出現頻度を導入した。また,総和情報量,平均情報量,最小情報量といった情報量関数を定義して前記3種類の出現頻度と組み合わせた情報利得尺度の特徴を比較した。著者らによる実装システムIFMAPを用いて新聞記事コーパスの有用系列パターン抽出を行い,情報利得上位100位の抽出パターンのパターン長,パターンの情報量値,出現頻度値,パターンに含まれるアイテムを比較した。さらに,系列パターンの有用性を評価する補完尺度としてパターン中に含まれるアイテムの豊富さを示す単語重なり尺度,相関ルールに対するコンフィデンス尺度としての先頭コンフィデンス,系列全体コンフィデンス,及び系列コサインを定義し,有用性を検証する予備実験を行った。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  パターン認識 
引用文献 (37件):
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る