特許
J-GLOBAL ID:200903045481775743

音声区間検出方式及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 高野 明近 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平3-166391
公開番号(公開出願番号):特開平5-006193
出願日: 1991年06月11日
公開日(公表日): 1993年01月14日
要約:
【要約】【目的】 時間非定常な騒音環境下においても、適切な雑音除去を行って音声区間を検出する。【構成】 第1の特徴量抽出部10で音声の特徴量(Xi)を求め、第2の特徴量抽出部20で雑音の特徴量(Ni)を求め、係数演算部40で、係数k(i)を、k(i)=〔X(i)+C1〕/〔N(i)+C2〕 (C1,C2=定数>0)を求め、雑音成分除去部50で、音声区間中の音声スペクトルの推定値S(i)を、S(i)=X(i)-k(i)・N(i)より求める。音声区間検出部60は、音声区間検出部30で検出された概略の音声区間の前後にそれぞれ予め定められた区間を付け加えた区間で、前記S(i)が閾値を超えたかどうかで、各チャンネル毎に、帯域毎の音声区間を検出し、音声区間である場合にはS(i)を、そうでない場合には0を出力する。
請求項(抜粋):
音声を入力するための第1の入力手段と、第1の入力手段で得られた第1の入力信号の複数の要素から成る特徴量を求める第1の特徴量抽出手段と、雑音を入力するための第2の入力手段と、第2の入力手段で得られた第2の入力信号の複数の要素から成る特徴量を求める第2の特徴量抽出手段と、上記第1の特徴量と上記第2の特徴量とから各要素毎に係数の演算を行う係数演算手段と、上記第2の特徴量と上記係数とを用いて上記第1の特徴量から雑音成分を除去することにより音声の特徴量を推定する雑音成分除去手段と、少なくとも上記雑音成分除去手段で推定された音声の特徴量を用いて、上記各要素毎に音声区間を検出する音声区間検出手段とを具備して成る事を特徴とする音声区間検出方式。
IPC (2件):
G10L 3/00 513 ,  G10L 3/02 301

前のページに戻る