特許
J-GLOBAL ID:200903048798867316

音声品質評価方法および記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平9-250913
公開番号(公開出願番号):特開平11-095795
出願日: 1997年09月16日
公開日(公表日): 1999年04月09日
要約:
【要約】【課題】 発声音声に対し、高いスコアを与え、誤った発声音声に対して低いスコアを与え、信頼度を向上する。【解決手段】 予め学習音声を用いて、その音素セグメントと正解音素の確率モデルとの尤度値がどのように広がりをもって分布するかの正解絶対対数尤度分布PG P1(x)と、各非正解音素確率モデルとの尤度値がどのように広がりをもって分布するかの非正解絶対対数尤度分布PN P1P2(x)とを予め求めておき、評価音声に対し、セグメントに分解して正解音素系列を割当(S1)、その各セグメントの正解音素P1のモデルの尤度SG P1=xを求め(S2)、そのxを用いて予め求めてPG P1(X)と各PN P1P2(x)を求め、これらの各差の合計値を累積的な絶対スコアSCP1(X)とする(S3)。
請求項(抜粋):
音響的特徴に関する確率モデルで表現された音素、音節、単語などの基本単位の複数の言語的カテゴリを用い、あらかじめ学習音声により、確率モデルから計算される正しいカテゴリとなる尤度の分布と、各誤ったカテゴリとなる尤度の分布とを求めておき、評価される音声サンプルと、その音声に対応した発声されるべき基本単位系列を入力するステップと、音声サンプルを基本単位に分解するステップと、上記分解された音声基本単位に、正しいカテゴリの確率モデルを当てはめて尤度を求めるステップと、上記求めた尤度と上記正しいカテゴリとなる尤度の分布、及び上記各誤ったカテゴリとなる尤度の分布とからその尤度が正解となる確からしさを示す値及び各非正解となる確からしさを示す値をそれぞれ求めるステップと、これら確からしさを示す値から品質を評価する絶対スコアを求めるステップとを有する音声品質評価方法。
IPC (4件):
G10L 5/04 ,  G10L 3/00 531 ,  G10L 3/00 535 ,  G10L 9/00
FI (4件):
G10L 5/04 E ,  G10L 3/00 531 E ,  G10L 3/00 535 ,  G10L 9/00 A

前のページに戻る