抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,誰もが気軽に情報発信を行う手段として,ブログ(blog)が注目されている。ブログでは,コメントを用いた情報交換やトラックバックを通じた関連情報の取得が容易である。しかし,それらの機能を対象として,広告や他サイトへの誘導を目的とするスパム投稿の増加が問題となっていることから,投稿のスパム判定を効果的に行うフィルタリング手法が求められている。既存研究では,メールのフィルタリングにおいて,スパムに出現する単語の特徴からスパム判定を行うベイジアンフィルタの研究が成果をあげている。しかし,これをブログに適用した場合,評価値を更新しスパム判定精度を維持するための長期的な人的コストが必要となる問題と,ブログ上の出現単語数の多さからすべての単語の相対的な出現回数が少なくなるためスパム判定の精度が低下するという問題がある。さらに,ブログ上の出現単語が時系列によって変化する点も考慮する必要がある。そこで,本研究では,これらの課題に対して,Webから自動的に取得した情報を用いてスパム判定の評価値を自動更新する手法,単語の相対的な出現回数の少なさに対応するため各単語の評価値をカテゴリ別に算出する手法と時系列情報から単語のスパム確率を補正する手法を用いることで,ブログスパムに適した判定手法の提案を目指す。評価実験では,上述した提案手法を用いた場合と用いなかった場合の比較を行い,提案手法の有用性を実証する。(著者抄録)