特許
J-GLOBAL ID:201403048130302686
類似度算出装置、類似度算出方法、及びプログラム
発明者:
,
,
,
,
出願人/特許権者:
代理人 (2件):
谷川 英和
, 森本 悟道
公報種別:特許公報
出願番号(国際出願番号):特願2010-150713
公開番号(公開出願番号):特開2012-014476
特許番号:特許第5522389号
出願日: 2010年07月01日
公開日(公表日): 2012年01月19日
請求項(抜粋):
【請求項1】意味的類似度の算出の対象となる第1の言語表現w1及び第2の言語表現w2を受け付ける受付部と、
コーパスにおける前記第1の言語表現w1の出現に関する情報である第1の文脈ベクトルと、前記コーパスにおける前記第2の言語表現w2の出現に関する情報である第2の文脈ベクトルとを取得する取得部と、
2個の文脈ベクトルφ1、φ2の類似度を計算する類似関数g(φ1、φ2)と、前記第1及び第2の文脈ベクトルからベイズ推定を用いて得られた確率分布とを用いて、前記第1の言語表現w1に対応する文脈ベクトルと、前記第2の言語表現w2に対応する文脈ベクトルとの類似度の期待値である意味的類似度を算出する算出部と、
前記算出部が算出した意味的類似度を出力する出力部と、を備え、
前記文脈ベクトルは共起頻度を示すものであって多項分布であり、
前記ベイズ推定の事前分布はディリクレ分布であり、
前記算出部は、
前記文脈ベクトルを用いてハイパーパラメータを補正した事後分布であるディリクレ分布の確率分布を用いて、前記意味的類似度を算出する、類似度算出装置。
IPC (3件):
G06F 17/30 ( 200 6.01)
, G06F 17/27 ( 200 6.01)
, G06F 17/21 ( 200 6.01)
FI (4件):
G06F 17/30 350 C
, G06F 17/30 170 A
, G06F 17/27 Z
, G06F 17/21 550 A
引用特許:
引用文献:
前のページに戻る