文献
J-GLOBAL ID:200902259298426337   整理番号:09A1037904

N-gramと離散型共起表現を用いたワードサラダ型スパム検出手法の提案

Proposal of Word Salad Spam Detection Method using N-gram and Interrupted Collocations
著者 (4件):
資料名:
巻: 2009  号:ページ: ROMBUNNO.DBS-NO.148(24)  発行年: 2009年08月15日 
JST資料番号: Z0031C  ISSN: 2186-2583  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
インターネット上にウェブページが爆発的に増加し,インターネットから得られる情報が重要になっている。しかし,ウェブページの爆発的な増加につれてスパム行為を行うページも同様に増加し,インターネットから得られる情報の価値を下げている。スパム行為には様々な手法があるが,本論文では自動的に文章を生成するワードサラダに着目し,ワードサラダ型のスパムを効率的に検出する手法を提案する。ワードサラダ型スパムを検出するため,n-gramと離散型共起表現を用いてカルバック・ライブラー情報量に基づく文章のスコアを計算し,計算したスコアに基づき判定を行う。提案手法の評価実験を行った結果,既存手法と比較してF値で0.18の性能の向上を確認できた。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
情報加工一般  ,  その他の情報処理  ,  データ保護 

前のページに戻る