文献
J-GLOBAL ID:200902209119762756   整理番号:08A1059476

単独記事フィルタリングを用いた時系列ニュース記事分類法の提案

著者 (5件):
資料名:
巻:号:ページ: 7-12  発行年: 2008年09月26日 
JST資料番号: L5754A  ISSN: 1883-1060  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
関連記事や最新話題語などの検出を目的として,インターネット上のニュース記事を対象としたクラスタリングが広く研究されている。しかし,従来のクラスタリング手法では,単独記事,すなわち,続報・派生記事が出ず,他記事との関連性を持たない記事がクラスタに取り込まれてしまうという欠点があった。本稿では,まず事前実験において集めたニュース記事群中において単独記事が多いことを確認し,次に,単独記事のフィルタリングを用いるクラスタリング手法を提案した.提案手法では,単独記事をフィルタリングするため,当該記事中に出現する固有名詞が予め設定した閾値以上であるものを単独記事の候補群とする.次に,記事中の地理的情報や,非単独記事固有の「~~問題で」「~~事件で」という特徴的な表現を用いて,単独記事候補群から非単独記事の可能性があるものを除外する.以上の手順で作成された記事群に対して既存の階層型クラスタリングを適用する.これによって,クラスタリングの対象となる記事数を減らすことができるため,計算時間の削減も可能となる.半年分の日本のニュース2,136記事を用いた評価で,最短距離法でクラスタリングする場合,本手法を適用することにより,精度を10.2%改善できると共に計算時間を約1/3に抑えることができた.
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理 
引用文献 (10件):
もっと見る

前のページに戻る