音声認識方法

発明者：
出願人/特許権者：
代理人 (1件)：滝本智之 (外1名)
公報種別：公開公報
出願番号（国際出願番号）：特願平8-161357
公開番号（公開出願番号）：特開平10-011085
出願日： 1996年06月21日
公開日（公表日）： 1998年01月16日
要約：

【要約】【課題】隠れマルコフモデルを用いた音声認識において、音声に重畳される雑音の種類またはSN比が発生途中に変化する音声を高い精度で認識することができる音声認識方法を提供することを目的とする。【解決手段】雑音が重畳された音声を認識する隠れマルコフモデルをNOVO変換と呼ばれる方法で生成する際に、あらかじめ、複数種類の雑音を用いて、各雑音を認識する隠れマルコフモデルを作成しておき、それらと認識対象単語用の隠れマルコフモデルに対してNOVO変換を適用することにより、雑音の種類が途中で変化した場合の雑音重畳音声を高い精度で認識する。また、異なるSN比に対応する複数の係数を用いてNOVO変換を行うことにより、SN比が発生途中に変化する音声を高い精度で認識する。

請求項（抜粋）：

単語を認識単位とする隠れマルコフモデルを用いて雑音が重畳された音声を認識する音声認識方法であって、認識に用いる単語HMMの生成時に、予め複数種の雑音から別々に生成しておいたそれぞれの雑音に対応する雑音HMMを結合し、その結合した雑音HMMと認識対象単語HMMとをNOVO変換で結合することにより、重畳される雑音の種類が途中で変化する場合にも音声を高い確率で認識することを特徴とする音声認識方法。

IPC (2件)：

G10L 3/00 535 , G10L 3/00 521

FI (2件)：

G10L 3/00 535 , G10L 3/00 521 L

引用特許：

審査官引用 (2件)

耐雑音音韻モデルの作成方式
公報種別：公開公報出願番号：特願平5-005688 出願人：日本電信電話株式会社
音声処理方法および音声処理装置
公報種別：公開公報出願番号：特願平7-244491 出願人：キヤノン株式会社

引用文献：

審査官引用 (3件)

前のページに戻る