特許
J-GLOBAL ID:200903078043037328

音素決定方法、その装置及びプログラム

発明者:
出願人/特許権者:
代理人 (2件): 草野 卓 ,  稲垣 稔
公報種別:公開公報
出願番号(国際出願番号):特願2002-239448
公開番号(公開出願番号):特開2004-077901
出願日: 2002年08月20日
公開日(公表日): 2004年03月11日
要約:
【課題】自動ラベリングの境界誤差を小とする。【解決手段】入力音声信号をフレームごとに、複数の帯域にメル周波数分割し(S1)、各帯域のパワーを求め、また各フレームの音声信号エネルギーを求めてこれらを含む音響特徴量ベクトルを生成し(S2)、予めこの種の音響特徴量ベクトルを用いて各音韻又は音韻境界についてのHMM(隠れマルコフモデル)を作っておき、入力音声信号における予め知られている音韻又は音韻境界と対応するHMMの系列と先に求めた特徴量ベクトル系列と尤度が最大となるように計算し(S3)、その時の音声信号の各フレームに対し、音韻又は音韻境界を表わす情報(ラベル)を付与する(S4)。【選択図】 図1
請求項(抜粋):
入力音声信号をフレームごとに複数の帯域にメル周波数分割する過程と、 上記分割された帯域ごとの入力音声信号のパワーをメルフィルタバンク係数として計算する過程と、 フレームごとに入力音声信号のエネルギーを計算する過程と、 メルフィルタバンク係数及びエネルギーを含む音響特徴量ベクトルごとに音韻又は音韻境界と対応付けられた音響モデルに対する、上記入力音声信号の音響特徴量ベクトルの音韻又は音韻境界の類似度を求める過程と、 各フレームごとに求めた類似度が最も高い音韻又は音韻境界を示すラベルを付与する過程と を有する音素決定方法。
IPC (4件):
G10L13/06 ,  G10L15/04 ,  G10L15/10 ,  G10L15/14
FI (4件):
G10L5/04 E ,  G10L3/00 535Z ,  G10L7/08 B ,  G10L3/00 515C
Fターム (2件):
5D015HH00 ,  5D015HH04
引用文献:
前のページに戻る