特許
J-GLOBAL ID:200903091415815566
音声区間検出装置および方法
発明者:
,
出願人/特許権者:
代理人 (1件):
磯野 道造
公報種別:公開公報
出願番号(国際出願番号):特願2003-401418
公開番号(公開出願番号):特開2004-310047
出願日: 2003年12月01日
公開日(公表日): 2004年11月04日
要約:
【課題】 有色ノイズのある音声信号においても音声区間を正確に検出できる音声区間検出装置および方法を提供すること。【解決手段】 音声信号が入力されると、入力された音声信号をフレーム単位に分割し、フレームに白色ノイズを混合して周辺ノイズを白色化し、白色化されたフレームからフレームのランダム性を表すランダムパラメータを抽出し、抽出されたランダムパラメータによってフレームを音声フレームとノイズフレームとに区分けした後、これらに基づいて音声の開始位置と終わりの位置を計算して音声区間を検出することにより、多くの有色ノイズが混入している音声信号においても正確に音声区間を検出できる音声区間検出装置100を構成する。【選択図】 図2
請求項(抜粋):
入力された音声信号をフレーム単位に分割する前処理部と、
前記前処理部から入力されたフレームに白色ノイズを混合する白色化部と、
前記白色化部から入力されたフレームからフレームのランダム性を表すランダムパラメータを抽出するランダムパラメータ抽出部と、
前記ランダムパラメータ抽出部を介して抽出されたランダムパラメータによってフレームを音声フレームとノイズフレームとに区分けするフレーム状態判断部と、
前記フレーム状態判断部から入力された音声フレームとノイズフレームとに基づいて音声の開始位置と終わりの位置を計算することにより、音声区間を検出する音声区間検出部とを備えることを特徴とする音声区間検出装置。
IPC (4件):
G10L11/02
, G10L15/04
, G10L15/20
, G10L21/02
FI (3件):
G10L3/00 513Z
, G10L3/00 513A
, G10L3/02 301D
Fターム (1件):
引用特許:
前のページに戻る