Pat
J-GLOBAL ID:200903056751839490

音声処理方法及びその方法を使用した装置及びそのプログラム

Inventor:
Applicant, Patent owner:
Agent (1): 草野 卓 (外1名)
Gazette classification:公開公報
Application number (International application number):2002230598
Publication number (International publication number):2003316378
Application date: Aug. 07, 2002
Publication date: Nov. 07, 2003
Summary:
【要約】【課題】 話者に依存しない発話状態判定を可能にする。【解決手段】 少なくとも基本周波数、パワー、動的特徴量の時間変化特性のいずれか又はこれらのフレーム間差分の少なくともいずれかを含む音声特徴量の組から成る音声特徴量ベクトルの強調状態での出現確率及び平静状態での出現確率をコードごとに格納した符号帳を用い、入力音声からフレームごとに得た音声特徴量の組を量子化した対応する音声特徴量ベクトルの強調状態及び平静状態での出現確率を求め、それらを比較して強調状態であるか否かを判定する。
Claim (excerpt):
フレーム毎の音声特徴量の組に基づき音声の強調状態を判定する音声処理方法であって、(a) 基本周波数、パワー、動的特徴量の時間変化特性の少なくともいずれか1つ及び/又はこれらのフレーム間差分の少なくともいずれか1つを含む音声特徴量の組から成る音声特徴量ベクトルと強調状態でのその音声特徴量ベクトルの出現確率がコードごとに格納された符号帳を用い、現フレームの上記音声特徴量の組を量子化した上記符号帳中の対応する音声特徴量ベクトルの強調状態での出現確率を求めるステップと、(b) 上記音声特徴量ベクトルの強調状態での出現確率に基づいて強調状態となる尤度を算出するステップと、(c) 上記強調状態となる尤度に基づいて上記現フレームを含む区間が強調状態であるか否かを判定するステップ、とを含むことを特徴とする音声処理方法。
IPC (7):
G10L 15/10 ,  G10L 11/06 ,  G10L 15/00 ,  G10L 15/02 ,  G10L 15/06 ,  G10L 15/14 ,  G10L 19/12
FI (7):
G10L 3/00 531 N ,  G10L 3/00 515 D ,  G10L 3/00 515 E ,  G10L 3/00 521 U ,  G10L 3/00 535 A ,  G10L 9/14 S ,  G10L 3/00 551 G
F-Term (5):
5D015AA04 ,  5D015DD03 ,  5D015FF06 ,  5D015HH23 ,  5D045DA20
Patent cited by the Patent:
Cited by examiner (5)
Show all

Return to Previous Page