特許
J-GLOBAL ID:200903036963105851

ディジタルコンテンツのキーワード抽出装置、方法及びコンピュータ読み取り可能な記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 志賀 正武
公報種別:公開公報
出願番号(国際出願番号):特願2000-300276
公開番号(公開出願番号):特開2002-108888
出願日: 2000年09月29日
公開日(公表日): 2002年04月12日
要約:
【要約】【課題】 多数のディジタルコンテンツから精度の高いキーワードを抽出して、効率よく検索を行えるようにする。【解決手段】 データベース部303に蓄積された複数のディジタルコンテンツにおけるタイトル、作者名、概要を含む各テキストデータから人物名を抽出すると共に、その人物名の出現頻度をコンテンツ毎に計算する。次に、人物名を要素とし出現頻度を要素値とする人物ベクトルをコンテンツ毎に作成し、人物ベクトルに基づいてコンテンツ間の類似度を求め、類似度に基づいてコンテンツをグループ分けする。また、各テキストデータから単語を抽出してキーワード候補とし、各候補の重要度を計算する。次に、キーワード候補を要素とし重要度を要素値とするキーワードベクトルを作成し、上記グループ毎にキーワードベクトルの和を求め、その結果から重要度の高いキーワード候補をそのグループのキーワードとして決定する。
請求項(抜粋):
それぞれタイトル、作者名、概要を含むテキストデータが付与された複数のディジタルコンテンツにおける各テキストデータから人物名を抽出する人物名抽出手段と、前記抽出された人物名の出現頻度をディジタルコンテンツ毎に計算する頻度計算手段と、前記人物名を要素とし、前記出現頻度を要素値とする人物ベクトルをディジタルコンテンツ毎に作成する人物ベクトル作成手段と、前記人物ベクトルに基づいてディジタルコンテンツ間の類似度を計算し、計算された類似度に基づいてディジタルコンテンツをグループに分類する分類手段とを設けたことを特徴とするディジタルコンテンツのキーワード抽出装置。
IPC (5件):
G06F 17/30 210 ,  G06F 17/30 ,  G06F 17/30 170 ,  G06F 17/30 340 ,  G06F 17/30 350
FI (5件):
G06F 17/30 210 A ,  G06F 17/30 210 D ,  G06F 17/30 170 A ,  G06F 17/30 340 B ,  G06F 17/30 350 C
Fターム (7件):
5B075ND03 ,  5B075NK04 ,  5B075NK31 ,  5B075NR12 ,  5B075PR04 ,  5B075PR06 ,  5B075QM08

前のページに戻る