Pat
J-GLOBAL ID:201403048130302686

類似度算出装置、類似度算出方法、及びプログラム

Inventor:
Applicant, Patent owner:
Agent (2): 谷川 英和 ,  森本 悟道
Gazette classification:特許公報
Application number (International application number):2010150713
Publication number (International publication number):2012014476
Patent number:5522389
Application date: Jul. 01, 2010
Publication date: Jan. 19, 2012
Claim (excerpt):
【請求項1】意味的類似度の算出の対象となる第1の言語表現w1及び第2の言語表現w2を受け付ける受付部と、 コーパスにおける前記第1の言語表現w1の出現に関する情報である第1の文脈ベクトルと、前記コーパスにおける前記第2の言語表現w2の出現に関する情報である第2の文脈ベクトルとを取得する取得部と、 2個の文脈ベクトルφ1、φ2の類似度を計算する類似関数g(φ1、φ2)と、前記第1及び第2の文脈ベクトルからベイズ推定を用いて得られた確率分布とを用いて、前記第1の言語表現w1に対応する文脈ベクトルと、前記第2の言語表現w2に対応する文脈ベクトルとの類似度の期待値である意味的類似度を算出する算出部と、 前記算出部が算出した意味的類似度を出力する出力部と、を備え、 前記文脈ベクトルは共起頻度を示すものであって多項分布であり、 前記ベイズ推定の事前分布はディリクレ分布であり、 前記算出部は、 前記文脈ベクトルを用いてハイパーパラメータを補正した事後分布であるディリクレ分布の確率分布を用いて、前記意味的類似度を算出する、類似度算出装置。
IPC (3):
G06F 17/30 ( 200 6.01) ,  G06F 17/27 ( 200 6.01) ,  G06F 17/21 ( 200 6.01)
FI (4):
G06F 17/30 350 C ,  G06F 17/30 170 A ,  G06F 17/27 Z ,  G06F 17/21 550 A
Patent cited by the Patent:
Cited by examiner (3)
Article cited by the Patent:
Return to Previous Page