特許
J-GLOBAL ID:200903074171118858

外乱成分抑圧装置、コンピュータプログラム、及び音声認識システム

発明者:
出願人/特許権者:
代理人 (1件): 清水 敏
公報種別:公開公報
出願番号(国際出願番号):特願2005-057993
公開番号(公開出願番号):特開2006-243290
出願日: 2005年03月02日
公開日(公表日): 2006年09月14日
要約:
【課題】加法性雑音及び残響等の外乱による影響を受ける実環境下での音声認識性能を改善し、外乱の成分の抑圧を短時間で行なうことができる外乱成分抑圧装置を提供する。【解決手段】外乱成分抑圧部114は、加法性雑音及び乗法性歪みが生じる環境下で目的音声を観測することにより得られる観測信号について、所定周期ごとにフレーム化された所定時間長のフレームよりそれぞれ抽出される特徴量124を受け、複数のパーティクルを有するパーティクルフィルタを用いて、外乱を表すパラメータ206をフレームごとに逐次生成するための外乱確率分布推定部200と、観測信号の特徴量124と、外乱の推定パラメータ206と、GMM130とを用いて、フレームごとに目的音声の推定特徴量126を算出するためのパラメータ生成部202及びクリーン音声推定部204とを含む。【選択図】 図5
請求項(抜粋):
外乱により加法性雑音及び乗法性歪みが生じる環境下で目的音声を観測することにより得られる観測信号の外乱成分を抑圧する外乱成分抑圧装置であって、 前記観測信号について所定周期ごとにフレーム化された所定時間長のフレームよりそれぞれ抽出される特徴量を受けて、複数のパーティクルを有するパーティクルフィルタを用いて、前記外乱を表す確率分布の推定パラメータを前記フレームごとに逐次生成するための外乱パラメータ推定手段と、 前記観測信号の特徴量と、前記推定パラメータと、前記目的音声に関する所定の音響モデルとを用いて、前記フレームごとに前記目的音声の推定特徴量を算出するための目的音声推定手段とを含む、外乱成分抑圧装置。
IPC (2件):
G10L 15/20 ,  G10L 21/02
FI (1件):
G10L3/02 301D
Fターム (2件):
5D015CC01 ,  5D015EE05
引用特許:
出願人引用 (1件)
  • 音声認識システム
    公報種別:公開公報   出願番号:特願2001-070561   出願人:株式会社エイ・ティ・アール音声言語通信研究所
審査官引用 (2件)
引用文献:
前のページに戻る