特許
J-GLOBAL ID:200903019481404078
話題語抽出方法及び装置及びプログラム及びプログラムを格納した記憶媒体
発明者:
,
,
出願人/特許権者:
代理人 (1件):
伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2004-331065
公開番号(公開出願番号):特開2006-139716
出願日: 2004年11月15日
公開日(公表日): 2006年06月01日
要約:
【課題】 電子掲示板に途中から参加するユーザが、議論されている話題が何であるかを容易に把握することを可能にする。【解決手段】 本発明は、電子掲示板の投稿記事を蓄積する記事データベースから、該当投稿記事のタイトルと本文を読み出して、形態素解析し、形態素解析された語句の単位時間における出現頻度を算出し、語句毎に、語句別出現頻度記憶手段に格納し、語句別出現頻度記憶手段から、語句毎の出現頻度を読み出して、該出現頻度が時系列に従って大きくなっている(伸びている)語句を話題語として抽出する。【選択図】 図1
請求項(抜粋):
インターネット上の電子掲示板の投稿記事の内容から話題語を抽出する話題語抽出方法において、
前記電子掲示板の投稿記事を蓄積する記事データベースから、該当投稿記事のタイトルと本文を読み出して、形態素解析する形態素解析ステップと、
前記形態素解析ステップで形態素解析された語句の単位時間における出現頻度を算出し、語句毎に、語句別出現頻度記憶手段に格納する出現頻度算出ステップと、
前記語句別出現頻度記憶手段から、語句毎の出現頻度を読み出して、該出現頻度が時系列に従って大きくなっている(伸びている)語句を話題語として抽出する話題語抽出ステップと、
を行うことを特徴とする話題語抽出方法。
IPC (1件):
FI (3件):
G06F17/30 210Z
, G06F17/30 170A
, G06F17/30 340B
Fターム (4件):
5B075ND03
, 5B075NK31
, 5B075PP02
, 5B075PP03
引用特許: