抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ブログの一種として,広告収入を目的としたスパムブログが多く見られる。スパムブログの現状を把握するために,一週間の更新ブログを分析用のデータセットとして用い,ランダム抽出したサンプルブログ中のスパム数を求め,全体のスパム割合を推定した。また,スパムブログが共参照クラスタを形成する特徴を利用した,スパムブログ抽出手法の開発と評価を行った。開発した手法は,スパムブログの3種類のシード(高出次数のシード,スパムキーワードにもとづくシード,それら2つの混合シード)を基点とした,共参照クラスタにもとづく連鎖的なスパムブログの抽出を行う。スパム抽出実験を行いF-Measureにより評価した結果,混合シードを用いると個別のシードを用いる場合よりスパム抽出精度が向上した。