特許
J-GLOBAL ID:200903066706665419

話者適応化装置、話者適応化方法、話者適応化プログラムを記録したコンピュータ読取可能な記録媒体、音声認識装置、音声認識方法および音声認識プログラムを記録したコンピュータ読取可能な記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 田澤 博昭 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-269068
公開番号(公開出願番号):特開2002-082688
出願日: 2000年09月05日
公開日(公表日): 2002年03月22日
要約:
【要約】【課題】 ある言語のノンネイティブ話者が発声したある言語音声になまりや曖昧な発音が含まれるため、音響モデルの話者適応化処理の精度低下が生じてしまうという課題があった。【解決手段】 入力音声を音響分析処理して切替手段3の端子aから特徴ベクトル時系列4を出力する音響分析手段2と、話者適応化用音声データに対応する複数の教師ラベルデータから構成されるマルチ教師ラベルデータ7を記憶するマルチ教師ラベル記憶手段6と、音響モデル9Aを記憶する音響モデル記憶手段8と、マルチ教師ラベルデータ7から教師ラベルデータを一つ選択するとともに、選択された教師ラベルデータを参照して特徴ベクトル時系列4と音響モデル9Aとを照合し、音響モデル9Aを話者適応化処理する教師ラベル選択型話者適応化手段10とを備えるようにする。
請求項(抜粋):
一つの話者適応化用音声データに対応した複数の教師ラベルデータからなるマルチ教師ラベルデータから、上記話者適応化用音声データを参照して一つの教師ラベルデータを選択し、上記教師ラベルデータを参照して音響モデルの話者適応化処理を行うことを特徴とする話者適応化装置。
IPC (2件):
G10L 15/06 ,  G10L 15/10
FI (2件):
G10L 3/00 521 S ,  G10L 3/00 531 K
Fターム (4件):
5D015AA06 ,  5D015HH11 ,  5D015HH15 ,  5D015JJ07

前のページに戻る