特許
J-GLOBAL ID:201203044589320016
キーワード提示装置、方法及びプログラム
発明者:
,
,
,
,
出願人/特許権者:
代理人 (18件):
蔵田 昌俊
, 河野 哲
, 中村 誠
, 福原 淑弘
, 峰 隆司
, 白根 俊郎
, 村松 貞男
, 野河 信久
, 幸長 保次郎
, 河野 直樹
, 砂川 克
, 勝村 紘
, 佐藤 立志
, 岡田 貴志
, 堀内 美保子
, 竹内 将訓
, 市原 卓三
, 山下 元
公報種別:公開公報
出願番号(国際出願番号):特願2010-217899
公開番号(公開出願番号):特開2012-073804
出願日: 2010年09月28日
公開日(公表日): 2012年04月12日
要約:
【課題】電子文書集合からキーワードを抽出し、クラスタリングして提示する。【解決手段】実施形態に係るキーワード提示装置は、文書集合から、所定の汎用概念辞書に規定されている形態素列を基本用語候補として抽出する抽出部101と、文書集合から、汎用概念辞書に規定されていない形態素列を専門用語として抽出する抽出部104とを含む。このキーワード提示装置は、基本用語候補の各々と専門用語との間の関連性を評価し、関連性の高い基本用語候補を優先的に基本用語として選定する選定部106を含む。このキーワード提示装置は、文書集合に基づく基本用語間の統計的な相関度と汎用概念辞書に基づく基本用語間の概念的な相関度との重み付き和を計算し、重み付き和に基づいて基本用語をクラスタリングするクラスタリング部107を含む。【選択図】図1
請求項(抜粋):
文書集合から、所定の汎用概念辞書に規定されている形態素列を複数の基本用語候補として抽出する第1の抽出部と、
前記文書集合から、前記汎用概念辞書に規定されていない形態素列を専門用語として抽出する第2の抽出部と、
前記基本用語候補の各々と前記専門用語との間の関連性を評価し、前記関連性の高い基本用語候補を優先的に基本用語として選定する第1の選定部と、
前記文書集合に基づく基本用語間の統計的な相関度と前記汎用概念辞書に基づく基本用語間の概念的な相関度との重み付き和を計算し、当該重み付き和に基づいて前記基本用語をクラスタリングするクラスタリング部と、
前記基本用語のクラスタリング結果に基づいて、各クラスタのキーワードを前記基本用語及び前記専門用語から選定する第2の選定部と、
選定されたキーワードを提示する提示部と
を具備する、キーワード提示装置。
IPC (1件):
FI (4件):
G06F17/30 210A
, G06F17/30 170A
, G06F17/30 210D
, G06F17/30 380E
Fターム (6件):
5B075ND03
, 5B075NK32
, 5B075NR05
, 5B075NR12
, 5B075PQ02
, 5B075PQ46
引用特許:
前のページに戻る