Pat
J-GLOBAL ID:200903008990989679

固有声に基いた最尤法を含む話者と環境適合化

Inventor:
Applicant, Patent owner:
Agent (1): 青山 葆 (外1名)
Gazette classification:公開公報
Application number (International application number):1999125125
Publication number (International publication number):1999338491
Application date: Apr. 30, 1999
Publication date: Dec. 10, 1999
Summary:
【要約】【課題】 新しい話者について多くの訓練データを要することなく話者および環境適応を実現する。【解決手段】 話者依存モデルのセットが比較的多数の訓練話者に関し、話者当り1モデルで訓練されるとともにモデルパラメータが所定の順序で抽出されて話者当り1個のスーパーベクトルのセットが構成される。次に、主成分解析が上記スーパーベクトルのセットに関して実行されて、固有音声空間を定義する固有ベクトルのセットが生成される。所望とあらば、ベクトルの数はデータ圧縮のため減少させることができる。その後に、新しい話者は、最尤評価に基いてスーパーベクトルが上記固有声空間内に存在するように制約することによってスーパーベクトルが構成される適合化データを与える。この新しい話者の固有空間内の結果の係数はその話者について適合化モデルが構成されるモデルパラメータの新しいセットを構成するために使用される。環境適応は、訓練データ内に環境変化を含ませることで達成できる。
Claim (excerpt):
話者適応の実行方法は以下のステップからなる:複数の訓練話者のためのモデルのセットを与えることにより、複数の訓練話者を表現する固有空間を構成するとともに、該固有空間を定義する主成分ベクトルのセットを生成するため上記モデルのセットに関し主成分解析を実行する;適合化モデルが上記固有空間内に存在するように適合化モデルを制約するため上記主成分ベクトルのセットを用いながら、上記適合化モデルを訓練するため新しい話者からの入力音声を用いて適合化モデルを生成する。
IPC (2):
G10L 3/00 521 ,  G10L 3/00
FI (2):
G10L 3/00 521 S ,  G10L 3/00 521 T
Patent cited by the Patent:
Cited by examiner (2)
  • 音声認識装置及び話者適応方法
    Gazette classification:公開公報   Application number:特願平9-009777   Applicant:株式会社東芝
  • 音声認識装置
    Gazette classification:公開公報   Application number:特願平9-323027   Applicant:本田技研工業株式会社

Return to Previous Page