特許
J-GLOBAL ID:200903014020934006

話者適応化方法および話者適応化装置

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 喜三郎 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-061497
公開番号(公開出願番号):特開平9-258769
出願日: 1996年03月18日
公開日(公表日): 1997年10月03日
要約:
【要約】【課題】 多数の不特定話者の音声を基に作成した不特定話者コードブックによる話者適応では、入力話者に対して的確な話者適応が行えない問題があった。【解決手段】 多数の不特定話者から得られた音声特徴データに基づいて複数の話者クラスを設定し、各話者クラスに属する話者の音声特徴データをもとに不特定話者コードブック23a、23bを作成するとともに、各話者クラスに属する話者の音声特徴ベクトル列から話者適応用単語ごとの重心ベクトル列を得て、重心ベクトル列記憶部24a,24bに記憶させておく。そして、入力話者の音声特徴ベクトル列と前記重心ベクトル列とを対応づけて、入力話者の音声がどの話者クラスに属するかを話者クラス判定部22により判定し、対応する不特定話者コードブックを選択し、音声認識時には入力話者の音声を選択されたコードブックによりコード化するとともに、対応する音声モデルを用いて音声認識する。
請求項(抜粋):
不特定多数の話者から得られた音声特徴データに基づいて分類された複数の話者クラスのそれぞれの話者クラスに属する話者の音声特徴ベクトル列を基に作成されたデータと、入力話者の音声特徴データとを比較して得られた結果により、入力話者の音声がどの話者クラスに属するかを判定し、その判定結果に基づいて、判定された話者クラスに対応した音声認識用の音声モデルを選択し、音声認識時には入力話者の音声をその選択された前記音声モデルを用いて音声認識処理することを特徴とする話者適応化方法。
IPC (3件):
G10L 3/00 531 ,  G10L 3/00 515 ,  G10L 9/10 301
FI (3件):
G10L 3/00 531 K ,  G10L 3/00 515 B ,  G10L 9/10 301 C
引用特許:
審査官引用 (3件)
  • 特開平4-324499
  • 特開平3-201079
  • 特開平1-216397

前のページに戻る