特許
J-GLOBAL ID:200903042938606862
話題語抽出方法及び装置及びプログラム及びプログラムを格納した記憶媒体
発明者:
,
,
出願人/特許権者:
代理人 (1件):
伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2004-331066
公開番号(公開出願番号):特開2006-139717
出願日: 2004年11月15日
公開日(公表日): 2006年06月01日
要約:
【課題】 電子掲示板に参加するユーザが、議論されているカテゴリの話題を容易に把握することを可能にする。【解決手段】 本発明は、カテゴリ毎に設定されているトピックについて、該トピック毎にトピックタイトル、該トピックの投稿数、投稿日時からなる情報を蓄積するトピック情報データベース(DB)からカテゴリ内にあるトピックタイトルを読み出して、該トピックタイトルを形態素解析し、形態素解析の結果の語句毎に、トピック情報DBのトピック内の投稿記事数を取得して、スコアを時系列に算出し、スコア記憶手段に該語句毎にスコアを格納し、スコア記憶手段から語句毎のスコアを取得して、時系列に従ってスコアが大きくなっている(伸びている)語句を前記カテゴリの話題語として抽出する。【選択図】 図1
請求項(抜粋):
インターネット上の時系列に従って記事が掲載される電子掲示板の内容から話題語を抽出する話題語抽出方法において、
投稿記事を格納する記事データベースから、カテゴリ毎に設定されているトピックについて、該トピック毎にトピックタイトル、該トピックに対する記事の投稿数、最新投稿日時からなる情報を抽出してトピック情報データベース(DB)に蓄積するトピック情報データベース作成ステップと、
前記トピック情報データベースからカテゴリ内にあるトピックタイトルを読み出して、該トピックタイトルを形態素解析する形態素解析ステップと、
前記トピック情報DBの前記トピック内の投稿記事数を取得して、前記形態素解析の結果の語句毎に、スコアを時系列に算出し、スコア記憶手段に該語句毎にスコアを格納するスコア算出ステップと、
前記スコア記憶手段から語句毎のスコアを取得して、時系列に従ってスコアが大きくなっている(伸びている)語句を前記カテゴリの話題語として抽出する話題語抽出ステップと、
を行うことを特徴とする話題語抽出方法。
IPC (1件):
FI (3件):
G06F17/30 210Z
, G06F17/30 170A
, G06F17/30 340B
Fターム (3件):
5B075ND03
, 5B075NK32
, 5B075PR04
引用特許: