特許
J-GLOBAL ID:200903024242849746

音声検出装置

発明者:
出願人/特許権者:
代理人 (1件): 小橋 信淳
公報種別:公開公報
出願番号(国際出願番号):特願平11-121457
公開番号(公開出願番号):特開2000-310993
出願日: 1999年04月28日
公開日(公表日): 2000年11月07日
要約:
【要約】【課題】雑音の無い音声信号を検出・抽出して音声認識する。【解決手段】 マイクロフォン2で集音し、対数パワー演算部4が音声データDiに基づいて対数パワーP(t)を生成する。音声区間決定部5が、周囲環境の雑音レベルより高レベルの第1の閾値と、雑音レベルより若干高く且つ第1の閾値より低レベルの第2の閾値に基づいて対数パワーP(t)のレベルを比較し、第2の閾値より高レベルの対数パワーP(t)のうち、時間的に連続して第1の閾値より高レベルに変化する対数パワーP(t)が得られたときの音声データDiを発話音声として検出する。そして、特徴抽出部6が、発話音声として検出された音声データDiに基づいて特徴抽出を行い、特徴ベクトルV(t)のデータを記憶部7に記憶させ、更に、音声認識部8が、特徴ベクトルV(t)のデータに基づいて音声認識し、その認識結果DJを信号処理部9へ出力する。
請求項(抜粋):
音を音声信号に変換して出力する音検知手段と、前記音声信号の電力成分信号を生成する電力変換手段と、所定レベルよの第1の閾値と、前記第1の閾値より低レベルの第2の閾値に基づいて前記電力成分信号のレベルを比較し、前記第2の閾値より高レベルの電力成分信号を検出すると、前記音声信号のうち、時間的に連続して第1の閾値より高レベルに変化する音声信号を発話音声として検出して抽出する音声区間決定手段と、前記音声区間決定手段において発話音声として検出される前記音声信号に基づいて音声の特徴情報を抽出する特徴抽出手段とを具備することを特徴とする音声検出装置。
Fターム (2件):
5D015CC14 ,  5D015DD02

前のページに戻る