特許
J-GLOBAL ID:200903011573262511

話題文書提示方法及び装置及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2004-309576
公開番号(公開出願番号):特開2006-120069
出願日: 2004年10月25日
公開日(公表日): 2006年05月11日
要約:
【課題】 最新の話題情報を取得したい利用者にとって効率的な情報取得環境を提供する。【解決手段】 本発明は、類似する文書が多いほど注目度が高いと見做す暫定話題度を求め、これに文書の作成時刻と現在時刻との差と予め設定した忘却曲線より求まる鮮度係数を乗算して話題度を求める。この為に、文書間の類似度を用いて、文書群をクラスタリングする。また、文書話題度算出に当たっては、注目文書に対し、他の文書との類似度を全て加算して暫定話題度とする。【選択図】 図1
請求項(抜粋):
作成時刻情報付きの膨大な文書群から、話題性の高い文書を自動的に選択して提示する話題文書提示装置における話題文書提示方法において、 入力文書中に含まれる単語に対して属性値を決定し、各入力文書を属性値列のベクトルに変換した文書ベクトルを用いて各文書間の類似度を算出し、類似度記録手段に記録する類似度算出ステップと、 前記類似度記録手段に記録されている前記文書間の類似度を用いて、入力文書群を、類似文書から少なくとも1つの部分集合に分割し、各部分集合に属する文書をクラスタ記録手段に保存するクラスタリングステップと、 前記類似度記録手段に記録されている前記文書間の類似度及び各文書の作成時刻情報を用いて、各文書に対して、類似する文書が多く、かつ、作成時刻が新しいほど大きな文書話題度を与え、文書話題度記録手段に保存する文書話題度算出ステップと、 前記クラスタ記録手段に保存されている前記各部分集合に属する文書及び、前記文書話題度記録手段に保存されている前記文書話題度を利用して、前記部分集合のそれぞれについて、該部分集合に含まれる文書群を、文書話題度の高い順に並べたデータを作成し、出力する提示データ作成ステップと、を行い、 前記文書話題度算出ステップにおいて、 注目文書に対し、他の文書との間の類似度を全て加算して暫定話題度を算出する暫定話題度算出ステップと、 前記注目文書の作成時刻情報が現在時刻に近いほど値が大きく、現在から遠いほど値が小さくなる関数によって該注目文書の新鮮度を決定する新鮮度決定ステップと、 と、を行うことを特徴とする話題文書提示方法。
IPC (1件):
G06F 17/30
FI (4件):
G06F17/30 220Z ,  G06F17/30 170A ,  G06F17/30 340A ,  G06F17/30 360Z
Fターム (4件):
5B075ND03 ,  5B075NS10 ,  5B075PQ02 ,  5B075PQ38
引用特許:
出願人引用 (2件) 審査官引用 (1件)
引用文献:
前のページに戻る