特許
J-GLOBAL ID:200903058579180432
音声認識システム
発明者:
,
,
出願人/特許権者:
代理人 (1件):
小橋 信淳
公報種別:公開公報
出願番号(国際出願番号):特願2000-282348
公開番号(公開出願番号):特開2002-091478
出願日: 2000年09月18日
公開日(公表日): 2002年03月27日
要約:
【要約】【課題】 乗法性歪と加法性雑音に対してロバストな音声認識システムを提供する。【解決手段】 HMM法で作成した音声HMM5から乗法性歪Hm(cep)を減算(合成)し、HMM法で作成した雑音HMM6から発話音声の乗法性歪Ha(cep)を減算(合成)し、それぞれの減算結果Sm(cep)と{Nm(cep)-Ha(cep)}を合成することによってケプストラム領域での合成HMM18を作成する。発話音声のケプストラムRa(cep)から乗法性歪Ha(cep)を減算(合成)することで得られるケプストラムR^a(cep)と合成HMM18のケプストラム領域での分布R^m(cep)とを照合し、最大尤度を与える合成HMMを音声認識結果とする。
請求項(抜粋):
少なくとも乗法性歪を含んだ音声に基づいて作成された音響モデルと雑音モデルを合成することで得られる合成モデルと、乗法性歪と加法性雑音を含んだ発話音声とを照合することで音声認識を行う音声認識システムであって、前記発話音声に含まれる乗法性歪の特徴成分を抽出する第1の抽出手段と、前記音響モデルに含まれる乗法性歪の特徴成分を抽出する第2の抽出手段と、前記発話音声と前記第1の抽出手段の抽出した前記乗法性歪の特徴成分とを合成する第1の演算手段と、前記音響モデルと前記第2の抽出手段の抽出した前記乗法性歪の特徴成分とを合成する第2の演算手段と、前記雑音モデルと前記第1の抽出手段の抽出した前記乗法性歪の特徴成分とを合成する第3の演算手段と、前記第2の演算手段の演算結果と前記第3の演算手段の演算結果とを合成することにより前記合成モデルを作成する作成手段とを備え、前記第1の演算手段の演算結果と前記合成モデルとを照合することにより、音声認識を行うことを特徴とする音声認識システム。
IPC (7件):
G10L 15/06
, G10L 15/00
, G10L 15/28
, G10L 15/20
, G10L 21/02
, G10L 15/02
, G10L101:04
FI (5件):
G10L101:04
, G10L 3/00 521 T
, G10L 3/00 551 Q
, G10L 3/02 301 C
, G10L 9/16 301 A
Fターム (5件):
5D015AA01
, 5D015BB01
, 5D015HH02
, 5D015HH21
, 5D015KK01
引用特許:
引用文献:
前のページに戻る