特許
J-GLOBAL ID:200903073724403134

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-316382
公開番号(公開出願番号):特開平8-171396
出願日: 1994年12月20日
公開日(公表日): 1996年07月02日
要約:
【要約】【目的】 音韻認識の誤りをより確実に訂正することができ、従来例に比較してより高い音声認識率を得ることができる音声認識装置を提供する。【構成】 照合部は入力発声音声を音韻HMMを用いて音素照合を行い発声音声に対応する認識された音韻系列とその音声区間を出力する。学習時に、認識された音韻系列とその音声区間を正解の音韻系列とその音声区間と比較し、互いに対応する音声区間で、認識された音韻系列が正解の音韻系列と異なっているときに、認識された誤り音韻系列と正解の音韻系列との対を誤り傾向テーブルとして抽出する。認識時に、認識された音韻系列とその音声区間とに基づいて、認識された音韻系列と誤り傾向テーブル内の誤り音韻系列とを比較して誤り音韻系列を検出したときに、認識された音韻系列を正解の音韻系列に置き換えることにより誤り訂正を行う。上記音韻系列は状態系列であってもよい。
請求項(抜粋):
入力された発声音声を音韻隠れマルコフモデルを用いて音素照合を行い、上記発声音声に対応する認識された音韻系列とその音声区間情報を出力する照合手段と、正解の音韻系列とその音声区間が既知である学習用発声音声に対する上記照合手段による照合結果である音韻系列とその音声区間情報とに基づいて、当該認識された音韻系列とその音声区間情報を、上記正解の音韻系列とその音声区間と比較し、互いに対応する音声区間で、認識された音韻系列が正解の音韻系列と異なっているときに、当該認識された誤り音韻系列と当該正解の音韻系列との対を抽出する誤り抽出手段と、上記誤り抽出手段によって抽出された誤り音韻系列と正解の音韻系列との対を、誤り傾向テーブルとして記憶する記憶手段と、音声認識すべき入力された発声音声に対する上記照合手段による照合結果である音韻系列とその音声区間情報とに基づいて、上記記憶手段によって記憶された誤り傾向テーブルを参照して、当該認識された音韻系列と、上記誤り傾向テーブル内の誤り音韻系列とを比較して、当該認識された音韻系列の中に上記誤り音韻系列を検出したときに、当該認識された音韻系列を、上記誤り音韻系列に対応する正解の音韻系列に置き換えることにより誤り訂正を行った音韻系列を、上記照合手段による照合結果である音韻系列に追加して、音韻認識結果候補として出力する誤り訂正処理手段とを備えたことを特徴とする音声認識装置。
IPC (3件):
G10L 3/00 535 ,  G10L 3/00 561 ,  G10L 3/00
引用特許:
審査官引用 (3件)
  • 特開昭60-118895
  • 特開昭60-073697
  • 補完音声認識装置
    公報種別:公開公報   出願番号:特願平5-177818   出願人:大阪瓦斯株式会社, 沖電気工業株式会社

前のページに戻る