文献
J-GLOBAL ID:200902248729898922   整理番号:09A0876426

イベント系列マイニングを目的とする新聞記事からの時間情報に基づく単語抽出

A Word Extraction Method from Newspaper Articles Based on Time Infomation for Event Sequence Mining
著者 (3件):
資料名:
巻: 24  号:ページ: 488-493 (J-STAGE)  発行年: 2009年 
JST資料番号: U0128A  ISSN: 1346-8030  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Webニュース,掲示板,ブログといった時系列テキストデータにおける話題の自動追跡の実現には時系列上のイベントを関連づけたイベント系列コーパスが有用である。本論文では,新聞記事コーパスに頻出するイベント系列を抽出するために,文章中の単語の重み付け手法であるTF・IDFを改良して時間情報を考慮したTF・IDayF法を提案した。ある日付dを特徴付ける単語wを含む記事の出現日数が小さいほど,wの重要度が大きいとして単語のバースト的な出現現象を利用するのではなく,蔓延的に出現する語を排除する。181日文の新聞記事見出し中の単語をTF-IDayF法で重み付けし,1日あたり上位20単語を重要単語として抽出する実験を行い,1)意味的観点,2)統計学的観点,3)系列データマイニングによる評価の点でTF-IDF法と比較した。その結果,TF-IDayF法は1)において妥当な重みを安定的に出力し,2)の点でイベント系列の要素として望ましい単語群を抽出しやすいことがわかった。また,3)ではTF-IDF法と比べて多くの無意味な系列パターンを抑制できることが確かめられた。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  人工知能 
引用文献 (8件):
  • [藤木 04]藤木稔明, 南野朋之, 鈴木泰裕, 奥村学: document streamにおけるburstの発見, 情報処理学会研究報告, 2004-NL-160, pp.85-92 (2004)
  • [広瀬 04]広瀬千夏, 高野洋, 岩沼宏治, 鍋島英知: 大規模時系列データからのイベントを象徴するキーワードの自動抽出. 人工知能学会研究会資料 SIG-KBS-A304, pp.239-244 (2004)
  • [Iwanuma 05] Iwanuma, K., Ishihara, R., Takano, Y, and Nabeshima, H: Extracting Frequent Subsequences from a Single Long Data Sequence: A Novel Anti-Monotonic Measure and a Simple On-Line Algorithm. Proceedings of the Fifth IEEE International Conference on Data Mining (ICDM '05), pp.186-193 (2005)
  • [北 02] 北研二,津田和彦,獅々堀正幹: 情報検索アルゴリズム. 共立出版株式会社 (2002)
  • [Kleinberg 02] Kleinberg, J.: Bursty and hierarchical structure in streams. Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp.91-101 (2002).
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る