特許
J-GLOBAL ID:200903025522303907

文書特徴表現計算装置、及びプログラム

発明者:
出願人/特許権者:
代理人 (2件): 伊東 忠彦 ,  石原 隆治
公報種別:公開公報
出願番号(国際出願番号):特願2008-128857
公開番号(公開出願番号):特開2009-277100
出願日: 2008年05月15日
公開日(公表日): 2009年11月26日
要約:
【課題】文書の特徴を人間にとって分かりやすく表現する。【解決手段】文書特徴表現計算装置において、索引語と、それに対応するベクトルとを含む概念ベースを格納する概念ベース格納手段と、前記文書から各索引語を抽出する索引語抽出手段と、前記概念ベース格納手段から、前記索引語抽出手段で抽出された各索引語に対応するベクトルを入力ベクトルとして取得し、当該入力ベクトルの集合を入力ベクトル集合格納手段に格納する入力ベクトル集合算出手段と、前記入力ベクトル集合格納手段に格納された入力ベクトルの集合に対する各代表ベクトルを、前記概念ベース格納手段に格納されたベクトルの集合から選択することにより算出する代表ベクトル集合算出手段と、前記代表ベクトル算出手段により算出された各代表ベクトルに対応する索引語と、その重みとを算出し、それらを出力する索引語重み算出手段と、を備える。【選択図】図1
請求項(抜粋):
入力された文書から、当該文書の特徴を表すための索引語と、その重みとを出力する文書特徴表現計算装置であって、 索引語と、それに対応するベクトルとを含む概念ベースを格納する概念ベース格納手段と、 前記文書から各索引語を抽出する索引語抽出手段と、 前記概念ベース格納手段から、前記索引語抽出手段で抽出された各索引語に対応するベクトルを入力ベクトルとして取得し、当該入力ベクトルの集合を入力ベクトル集合格納手段に格納する入力ベクトル集合算出手段と、 前記入力ベクトル集合格納手段に格納された入力ベクトルの集合に対する各代表ベクトルを、前記概念ベース格納手段に格納されたベクトルの集合から選択することにより算出する代表ベクトル集合算出手段と、 前記代表ベクトル算出手段により算出された各代表ベクトルに対応する索引語と、その重みとを算出し、それらを出力する索引語重み算出手段と、 を備えたことを特徴とする文書特徴表現計算装置。
IPC (1件):
G06F 17/30
FI (2件):
G06F17/30 210A ,  G06F17/30 170A
Fターム (2件):
5B075ND03 ,  5B075NK32
引用特許:
出願人引用 (2件) 審査官引用 (4件)
全件表示

前のページに戻る