特許
J-GLOBAL ID:200903078612840789
音声区間検出方法
発明者:
出願人/特許権者:
代理人 (1件):
小池 晃 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-024543
公開番号(公開出願番号):特開平6-236195
出願日: 1993年02月12日
公開日(公表日): 1994年08月23日
要約:
【要約】【構成】 入力音声信号から処理すべき1フレーム分のデータを抽出し(S1)、該1フレームの実効値(RMS値)Rを計算し(S2)する。また、音声区間の最新の30フレームのRMSの平均値RV を計算しておき、各フレーム毎のRMS値RをRV で除算した値R/RV を求める。音声区間中は、この値R/RVが所定の閾値KV より小さくなることを検出し、これがm(例えば15)フレーム連続するか否かを判別して(S6)、YESのときには無音声区間の開始点とする(S9)。【効果】 雑音のある環境下でも音声区間の検出を確実に行えるようにし、かつ演算量を少なくして電力消費を低減することができる。
請求項(抜粋):
入力された音声信号を一定サンプル数のフレームを単位として分割し、各フレーム毎に音声の有無を判別して音声の有る区間を検出する音声区間検出方法において、音声区間とされた複数フレームの平均パワーにより各フレームのパワーを正規化する工程と、この正規化された値を所定の閾値と比較して音声区間を検出する工程とを有することを特徴とする音声区間検出方法。
前のページに戻る