特許
J-GLOBAL ID:200903022969751800

話者適応化方法および話者適応化装置

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 喜三郎 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-053292
公開番号(公開出願番号):特開平9-244683
出願日: 1996年03月11日
公開日(公表日): 1997年09月19日
要約:
【要約】【課題】 不特定話者音声認識においては、一人の標準話者から作成したコードブックを入力話者の音声特徴空間にマッピングする話者適応では、高精度な話者適応が行えないという問題があった。【解決手段】 ある単語について複数の不特定の話者の発する音声データを分析して得られた不特定話者ごとの音声特徴ベクトル列を得て、これら不特定話者ごとの特徴ベクトル列から重心ベクトル列を求めて重心ベクトル列記憶部43に記憶しておく。また、入力話者が発する単語の音声データから得られた特徴ベクトル列を入力データ記憶部41に記憶し、話者適応処理部42により、前記入力話者特徴ベクトル列と前記重心ベクトル列とを対応付けし、前記重心ベクトル列を構成する各重心ベクトルに対応した差分ベクトルを求め、その差分ベクトルを用いて、入力話者コードブックのコードベクトルを求める。
請求項(抜粋):
ある単語について複数の不特定の話者の発する音声データを分析して得られた不特定話者ごとの音声特徴ベクトル列を得て、これら不特定話者ごとの特徴ベクトル列から重心ベクトル列を求めておき、入力話者が発する前記ある単語の音声データから得られた特徴ベクトル列と前記重心ベクトル列とを対応付けし、前記重心ベクトル列を構成する各重心ベクトルに対応した差分ベクトルを求め、その差分ベクトルを用いて、入力話者コードブックのコードベクトルを求めることを特徴とする話者適応化方法。
IPC (2件):
G10L 3/00 531 ,  G10L 3/00 515
FI (2件):
G10L 3/00 531 K ,  G10L 3/00 515 B
引用特許:
審査官引用 (3件)
  • 特開平4-121791
  • 特開平1-259626
  • 特開平4-305699

前のページに戻る