文献
J-GLOBAL ID:200902267935133678   整理番号:08A0254238

カテゴリ分類と時系列情報に基づくブログスパム判定手法の提案

Proposal for Detection Method of Blog Spam Based on Categorization and Time Series Information
著者 (5件):
資料名:
巻: 49  号:ページ: 1119-1130  発行年: 2008年03月15日 
JST資料番号: Z0778A  ISSN: 0387-5806  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,誰もが気軽に情報発信を行う手段として,ブログ(blog)が注目されている。ブログでは,コメントを用いた情報交換やトラックバックを通じた関連情報の取得が容易である。しかし,それらの機能を対象として,広告や他サイトへの誘導を目的とするスパム投稿の増加が問題となっていることから,投稿のスパム判定を効果的に行うフィルタリング手法が求められている。既存研究では,メールのフィルタリングにおいて,スパムに出現する単語の特徴からスパム判定を行うベイジアンフィルタの研究が成果をあげている。しかし,これをブログに適用した場合,評価値を更新しスパム判定精度を維持するための長期的な人的コストが必要となる問題と,ブログ上の出現単語数の多さからすべての単語の相対的な出現回数が少なくなるためスパム判定の精度が低下するという問題がある。さらに,ブログ上の出現単語が時系列によって変化する点も考慮する必要がある。そこで,本研究では,これらの課題に対して,Webから自動的に取得した情報を用いてスパム判定の評価値を自動更新する手法,単語の相対的な出現回数の少なさに対応するため各単語の評価値をカテゴリ別に算出する手法と時系列情報から単語のスパム確率を補正する手法を用いることで,ブログスパムに適した判定手法の提案を目指す。評価実験では,上述した提案手法を用いた場合と用いなかった場合の比較を行い,提案手法の有用性を実証する。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
その他の情報処理  ,  人工知能 
引用文献 (20件):
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る