特許
J-GLOBAL ID:201003036984298146
地域特性辞書生成方法及び装置
発明者:
出願人/特許権者:
代理人 (1件):
正林 真之
公報種別:公開公報
出願番号(国際出願番号):特願2009-000560
公開番号(公開出願番号):特開2010-160534
出願日: 2009年01月06日
公開日(公表日): 2010年07月22日
要約:
【課題】地域毎に特徴語を抽出して、特徴語に関する地域特性辞書を生成する方法及び装置を提供すること。【解決手段】地域特性辞書生成サーバ1は、ブログサーバ2に格納されているブログのうち、地域ブログの情報を収集するブログ情報収集部11と、収集された地域ブログの情報より用語を抽出して、用語の出現数の合計値を地域毎に計数する用語出現数計数部12と、地域ブログの数量及び用語が含まれている地域ブログの数量を計数するブログ数計数部13と、地域における用語の出現数の合計値、地域ブログの数量、及び用語が含まれている地域ブログの数量に基づいて所定の演算を行い、地域における用語の出現頻度の偏差を算出する用語出現偏差算出部14と、算出した用語の出現頻度の偏差が予め定めた閾値よりも大きい場合に、用語の出現頻度の偏差を算出した地域の地域特性辞書である辞書DB22に、当該用語を登録する辞書登録部15とを備える。【選択図】図1
請求項(抜粋):
特定地域ブログに含まれる特徴語を用語の出現頻度の偏りから抽出して、特徴語に関する地域特性辞書を生成する地域特性辞書生成方法であって、
複数の地域ブログから用語を抽出して、特定地域における該用語の出現数の合計値を計数するステップと、
前記地域ブログの数量及び前記用語が含まれている地域ブログの数量を計数するステップと、
前記合計値、前記地域ブログの数量、及び前記用語が含まれている地域ブログの数量に基づいて所定の演算を行い、前記特定地域における前記用語の出現頻度の偏差を算出するステップと、
前記算出した前記偏差が予め定めた閾値よりも大きい場合に、前記特定地域の地域特性辞書に前記用語を登録するステップと、
を備えることを特徴とする地域特性辞書生成方法。
IPC (3件):
G06F 17/27
, G06F 17/30
, G06F 13/00
FI (4件):
G06F17/27 Z
, G06F17/30 340A
, G06F13/00 560C
, G06F17/30 230Z
Fターム (10件):
5B075KK02
, 5B075ND03
, 5B075NK32
, 5B075UU40
, 5B091AA15
, 5B091CA02
, 5B091CC01
, 5B091CC04
, 5B091CC16
, 5B091EA24
引用特許:
前のページに戻る