Pat
J-GLOBAL ID:200903061400078984

音声認識装置および単語構成要素の辞書並びに隠れマルコフモデルの学習方法

Inventor:
Applicant, Patent owner:
Agent (1): 鈴江 武彦
Gazette classification:公開公報
Application number (International application number):1995235418
Publication number (International publication number):1997081177
Application date: Sep. 13, 1995
Publication date: Mar. 28, 1997
Summary:
【要約】【課題】パターン変形が著しい雑音環境下でも高い認識性能が実現でき、かつ語彙の拡張も容易にする。【解決手段】音韻辞書学習部21では、学習用音声データベース23中のクリーンな音声データと雑音データベース25中の雑音データとから雑音重畳音声を生成し、この音声を用いて音韻辞書記憶部15中の各音韻辞書の学習を行う。一方、音韻HMM学習部22では、別の学習用音声データベース24中のクリーンな音声データと雑音データベース25中の雑音データとから雑音重畳音声を生成し、この音声を音声分析部12に与えることで得られる当該音声の特徴パラメータの時系列と音韻辞書学習部21により学習された韻辞書記憶部15中の音韻辞書との照合を音韻類似度計算部13にて行わせて類似度の時系列を求め、この類似度の時系列を用いて音韻HMM記憶部16中の音韻HMMの学習を行う。
Claim (excerpt):
音声データを人力する音声入力手段と、前記音声入力手段により入力された音声データを分折して特徴パラメータの時系列を求める音声分析手段と、前記音声分析手段により求められた特徴パラメータの時系列と単語構成要素の辞書との照合を行って類似度の時系列を求める類似度計算手段と、前記類似度計算手段により求められた類似度の時系列と単語構成要素の隠れマルコフモデルとを用いて音声認識を行う単語照合手段と、雑音のないクリーンな第1の音声データと雑音データとから第1の雑音重畳音声を生成し、当該第1の雑音重畳音声を用いて前記単語構成要素の辞書の学習を行う第1の学習手段と、前記第1の音声データとは別の雑音のないクリーンな第2の音声データと雑音データとから第2の雑音重畳音声を生成し、当該第2の雑音重畳音声を前記音声分析手段に与えることで得られる当該第2の雑音重畳音声の特徴パラメータの時系列と前記第1の学習手段により学習された前記単語構成要素の辞書との照合を前記類似度計算手段にて行わせて類似度の時系列を求め、この類似度の時系列を用いて前記単語構成要素の隠れマルコフモデルの学習を行う第2の学習手段とを具備することを特徴とする音声認識装置。
IPC (2):
G10L 3/00 521 ,  G10L 3/00 535
FI (2):
G10L 3/00 521 L ,  G10L 3/00 535
Patent cited by the Patent:
Cited by applicant (8)
  • 音声認識方法
    Gazette classification:公開公報   Application number:特願平4-004642   Applicant:松下電器産業株式会社
  • 音声認識方法
    Gazette classification:公開公報   Application number:特願平3-234388   Applicant:松下電器産業株式会社
  • 特開平2-238495
Show all

Return to Previous Page