特許
J-GLOBAL ID:200903022340231804

フィルタリング装置、およびフィルタリング方法

発明者:
出願人/特許権者:
代理人 (1件): 工藤 一郎
公報種別:公開公報
出願番号(国際出願番号):特願2008-130112
公開番号(公開出願番号):特開2009-277156
出願日: 2008年05月16日
公開日(公表日): 2009年11月26日
要約:
【課題】従来の登録NGワードやURLを利用するフィルタリング技術では、結果的に「フィルタリング漏れ」が生じている、という課題がある。また結果的に健全なWebサイトもフィルタリングしてしまっている可能性がある、という課題もある。【解決手段】上記課題解決のため、比較対照のモデルとなる有害Webサイトを予め用意しておき、そのWebサイトの内容と、クローラが収集するWebサイトの内容との類似度を、「両Web文書の形態素解析の結果得られる単語の出現頻度の加重結果」を利用して総合的に判断する。そしてその判断結果に従って、自動的にWebサイトの有害/無害の判断用の参照データベースを生成する機能を有することを特徴とするフィルタリング装置を提供する。【選択図】図2
請求項(抜粋):
解析対象文章を取得するクローラ部と、 クローラ部にて得られる解析対象文章を形態素解析処理する形態素解析処理部と、 形態素解析処理により得られたキーワードを解析対象文章での出現頻度に基づいて加重した結果である解析対象加重結果を取得する解析対象加重結果取得部と、 サンプル文章の形態素解析により得られたキーワードをそのサンプルとなる文章中での出現頻度に基づいて加重した結果であるサンプル加重結果を取得するサンプル加重結果取得部と、 解析対象加重結果とサンプル加重結果とを代入値とする所定の演算式を格納する演算式格納部と、 解析対象加重結果とサンプル加重結果と、演算式とに従って演算することで解析対象文章とサンプル文章との類似度を求める類似度演算部と、 類似度演算部での演算結果が所定の条件を満たす演算結果である場合には解析対象文章の識別情報をサンプル文章に類似する文章であるとして蓄積する類似文章蓄積部と、 を有するフィルタリング装置。
IPC (3件):
G06F 13/00 ,  G06F 21/24 ,  G06F 21/20
FI (3件):
G06F13/00 540E ,  G06F12/14 560B ,  G06F15/00 330A
Fターム (9件):
5B017AA03 ,  5B017BA06 ,  5B017CA16 ,  5B285AA04 ,  5B285BA09 ,  5B285CA02 ,  5B285CA04 ,  5B285CA06 ,  5B285CA16
引用特許:
出願人引用 (4件)
全件表示
審査官引用 (3件)
引用文献:
前のページに戻る