特許
J-GLOBAL ID:200903090231413728

話者特徴推定装置および話者特徴推定方法、クラスタモデル作成装置、音声認識装置、音声合成装置、並びに、プログラム記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-382383
公開番号(公開出願番号):特開2002-182683
出願日: 2000年12月15日
公開日(公表日): 2002年06月26日
要約:
【要約】【課題】 梨状窩形状の個人差等による音声スペクトル高周波数帯域の変動を除去する。【解決手段】 特徴量写像部1および関数推定部3は、複数の写像関数を用いて式(1)に基づく最尤推定によって一つの写像関数を選択し、話者特徴として出力する。その際に、特徴量変換部4は、特徴量写像部1によって複数の写像関数の夫々で写像された入力話者の音響特徴量を、声道における梨状窩形状の個人差等によって変動する音声スペクトル高周波数帯域において、標準話者モデル格納部2に格納された標準話者モデルから抽出された音響特徴量で変換して、関数推定部3に入力するようにしている。こうして、声道における梨状窩形状の個人差等による音声スペクトル高周波数帯域の変動の影響を除去して、話者特徴としての写像関数を精度よく推定する。
請求項(抜粋):
入力話者の音響特徴量を標準話者に類似した音響特徴量に写像する写像関数を推定し、推定した写像関数の情報を話者特徴とする話者特徴推定装置において、標準話者の音響特徴量に関する情報を格納する標準話者音響情報格納手段と、入力話者の音響特徴量を写像する特徴量写像手段と、上記入力話者の音響特徴量における声道の梨状窩形状の個人差によって変動が生ずる領域を、上記標準話者音響情報格納手段に格納された標準話者の音響特徴量に関する情報を用いて変換する特徴量変換手段と、上記写像および変換が行われた入力話者の音響特徴量と、上記標準話者の音響特徴量に関する情報とに基づいて、写像関数を推定する関数推定手段を備えたことを特徴とする話者特徴推定装置。
IPC (5件):
G10L 15/06 ,  G10L 15/10 ,  G10L 15/14 ,  G10L 15/20 ,  G10L 21/02
FI (4件):
G10L 3/00 521 S ,  G10L 3/00 531 J ,  G10L 3/00 535 Z ,  G10L 3/02 301 A
Fターム (6件):
5D015AA02 ,  5D015CC04 ,  5D015EE03 ,  5D015GG01 ,  5D015GG03 ,  5D015HH23
引用特許:
審査官引用 (1件)

前のページに戻る