特許
J-GLOBAL ID:201703008563668465
キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
発明者:
出願人/特許権者:
代理人 (3件):
棚井 澄雄
, 鈴木 慎吾
, 酒井 太一
公報種別:公開公報
出願番号(国際出願番号):特願2015-249124
公開番号(公開出願番号):特開2017-117021
出願日: 2015年12月21日
公開日(公表日): 2017年06月29日
要約:
【課題】利用者が知りたい情報に応じたキーワードを抽出することができるキーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、プログラムを提供することを目的とする。【解決手段】検索キーワードに基づいてメインコンテンツを含む複数のコンテンツを検索する検索部と、検索された複数のコンテンツの中から所定のドメインのコンテンツを除去する第1ノイズ除去部と、所定のドメインのコンテンツが除去された複数のコンテンツの中から1つのコンテンツを逐次選択し、選択したコンテンツからリンク先を示す情報を抽出し、抽出したリンク先の情報と、選択した前記コンテンツの情報とを比較して類似している情報を選択したコンテンツの情報から除去してメインコンテンツを抽出するメインコンテンツ抽出部と、メインコンテンツ抽出部によって抽出されたメインコンテンツのテキストから複数のキーワードを抽出するキーワード抽出部と、を備える。【選択図】図2
請求項(抜粋):
検索キーワードに基づいてメインコンテンツを含む複数のコンテンツを検索する検索部と、
前記検索部によって検索された前記複数のコンテンツの中から、キーワードの抽出において意味を成していない所定のドメインのコンテンツを除去する第1ノイズ除去部と、
前記第1ノイズ除去部によって前記所定のドメインのコンテンツが除去された前記複数のコンテンツの中から1つの前記コンテンツを逐次選択し、選択した前記コンテンツからリンク先を示す情報を抽出し、抽出したリンク先の情報と、選択した前記コンテンツの情報とを比較して類似している情報を、選択した前記コンテンツの情報から除去してメインコンテンツを抽出するメインコンテンツ抽出部と、
前記メインコンテンツ抽出部によって抽出された前記メインコンテンツのテキストから複数のキーワードを抽出するキーワード抽出部と、
を備えるキーワード抽出装置。
IPC (1件):
FI (3件):
G06F17/30 210A
, G06F17/30 419B
, G06F17/30 140
引用特許: