特許
J-GLOBAL ID:201503035631396012

音声信号解析装置、方法、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人太陽国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2013-182112
公開番号(公開出願番号):特開2015-049433
出願日: 2013年09月03日
公開日(公表日): 2015年03月16日
要約:
【課題】音声信号からフォルマント周波数軌跡と音素境界を精度よく推定することができる。【解決手段】観測スペクトル包絡系列算出部22により、音声信号の時系列データを入力として、各時刻tにおける各周波数ωの観測時間周波数成分yω,tを表すスペクトル包絡を算出し、初期パラメータ設定部24により、パラメータ各々の初期値を設定し、パラメータ更新部30により、各時刻tにおけるスペクトル包絡が与えられたときの、CWMパラメータ群、HMMパラメータ群、及び調音ターゲット系列の確率を表す目的関数を最大化するように、各時刻tにおけるスペクトル包絡、CWMパラメータ群、HMMパラメータ群、及び調音ターゲット系列に基づいて、CWMパラメータ群、HMMパラメータ群、及び調音ターゲット系列を更新し、収束判定部28により、予め定められた収束条件を満たすまで、パラメータ更新部30による更新を繰り返し行う。【選択図】図6
請求項(抜粋):
音声信号の時系列データを入力として、各時刻tにおける各周波数ωの観測時間周波数成分yω,tを表すスペクトル包絡を算出する観測スペクトル包絡系列算出部と、 K個のガウス分布kの各々についての各時刻lの平均μk,l、K個のガウス分布kの各々についての各時刻lの分散の逆数ρk,l、及びK個のガウス分布kの各々についての各時刻lの重みwk,lを含むCWMパラメータ群と、隠れマルコフモデルの各時刻kの状態のインデックスskからなる状態系列^s、隠れマルコフモデルの前記状態i',i間の各々の遷移確率Φi',i、K個のガウス分布kの各々についての各状態iにおける前記重みwk,lの分布を表すパラメータb(w)k,i、K個のガウス分布kの各々についての各状態iにおける前記分散の逆数ρk,lの分布を表すパラメータb(ρ)k,i、及びK個のガウス分布kの各々についての各状態iにおける前記平均μk,lの正規分布の平均mk,iを含むHMMパラメータ群と、K個のガウス分布kの各々についての各時刻lの調音ターゲットのパラメータuk,lを含む調音ターゲット系列との各々の初期値を設定する初期パラメータ設定部と、 各時刻tにおける前記スペクトル包絡が与えられたときの、前記CWMパラメータ群、前記HMMパラメータ群、及び前記調音ターゲット系列の確率を表す目的関数を最大化するように、各時刻tにおける前記スペクトル包絡、前記CWMパラメータ群、前記HMMパラメータ群、及び前記調音ターゲット系列に基づいて、前記CWMパラメータ群、前記HMMパラメータ群、及び前記調音ターゲット系列を更新するパラメータ更新部と、 予め定められた収束条件を満たすまで、前記パラメータ更新部による更新を繰り返し行う収束判定部と、 を含む音声信号解析装置。
IPC (2件):
G10L 25/15 ,  G10L 15/04
FI (2件):
G10L25/15 ,  G10L15/04 200
引用文献:
出願人引用 (1件)
  • フォルマント周波数軌跡を潜在パラメータとした音声スペクトル生成過程の確率モデル
審査官引用 (1件)
  • フォルマント周波数軌跡を潜在パラメータとした音声スペクトル生成過程の確率モデル

前のページに戻る