特許
J-GLOBAL ID:200903056751839490
音声処理方法及びその方法を使用した装置及びそのプログラム
発明者:
,
,
出願人/特許権者:
代理人 (1件):
草野 卓 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2002-230598
公開番号(公開出願番号):特開2003-316378
出願日: 2002年08月07日
公開日(公表日): 2003年11月07日
要約:
【要約】【課題】 話者に依存しない発話状態判定を可能にする。【解決手段】 少なくとも基本周波数、パワー、動的特徴量の時間変化特性のいずれか又はこれらのフレーム間差分の少なくともいずれかを含む音声特徴量の組から成る音声特徴量ベクトルの強調状態での出現確率及び平静状態での出現確率をコードごとに格納した符号帳を用い、入力音声からフレームごとに得た音声特徴量の組を量子化した対応する音声特徴量ベクトルの強調状態及び平静状態での出現確率を求め、それらを比較して強調状態であるか否かを判定する。
請求項(抜粋):
フレーム毎の音声特徴量の組に基づき音声の強調状態を判定する音声処理方法であって、(a) 基本周波数、パワー、動的特徴量の時間変化特性の少なくともいずれか1つ及び/又はこれらのフレーム間差分の少なくともいずれか1つを含む音声特徴量の組から成る音声特徴量ベクトルと強調状態でのその音声特徴量ベクトルの出現確率がコードごとに格納された符号帳を用い、現フレームの上記音声特徴量の組を量子化した上記符号帳中の対応する音声特徴量ベクトルの強調状態での出現確率を求めるステップと、(b) 上記音声特徴量ベクトルの強調状態での出現確率に基づいて強調状態となる尤度を算出するステップと、(c) 上記強調状態となる尤度に基づいて上記現フレームを含む区間が強調状態であるか否かを判定するステップ、とを含むことを特徴とする音声処理方法。
IPC (7件):
G10L 15/10
, G10L 11/06
, G10L 15/00
, G10L 15/02
, G10L 15/06
, G10L 15/14
, G10L 19/12
FI (7件):
G10L 3/00 531 N
, G10L 3/00 515 D
, G10L 3/00 515 E
, G10L 3/00 521 U
, G10L 3/00 535 A
, G10L 9/14 S
, G10L 3/00 551 G
Fターム (5件):
5D015AA04
, 5D015DD03
, 5D015FF06
, 5D015HH23
, 5D045DA20
引用特許:
前のページに戻る