特許
J-GLOBAL ID:201103012785157658
バレーパーセンテージを使用した純粋音声の検出
発明者:
,
,
出願人/特許権者:
代理人 (4件):
濱中 淳宏
, 勝本 龍二
, 谷 義一
, 阿部 和夫
公報種別:特許公報
出願番号(国際出願番号):特願2000-585861
特許番号:特許第4652575号
出願日: 1999年11月30日
請求項(抜粋):
【請求項1】純粋音声信号および非音声信号または混合音声信号を有するオーディオ信号を入力したコンピュータにおいて、前記オーディオ信号から純粋音声信号を検出する方法であって、前記コンピュータの処理装置は、
前記コンピュータに入力された前記オーディオ信号を離散的なオーディオ標本のストリームに変換し、
前記オーディオ信号からウィンドウを用いてバレーパーセンテージを計算し、前記バレーパーセンテージの計算は、前記ストリームの所与のオーディオ標本に対し、
前記ウィンドウを通して見える、前記所与のオーディオ標本の周囲の複数のオーディオ標本に対するしきい値エネルギーレベルを決定することと、
低エネルギー成分である前記所与のオーディオ標本の周囲の複数のオーディオ標本の割合に基づいて、前記所与のオーディオ標本において、前記バレーパーセンテージを決定することであって、前記低エネルギー成分は、前記所与のオーディオ標本の周囲の前記複数のオーディオ標本に対する前記しきい値エネルギーレベルよりも低いエネルギーレベルを有することと
を含み、
前記バレーパーセンテージをバレーパーセンテージしきい値と比較して、前記所与のオーディオ標本および前記ストリームの1つまたは複数の他のオーディオ標本を純粋音声区分または非音声区分に分類し、
前記オーディオ信号の純粋音声として分類された部分と前記オーディオ信号の非音声として分類された部分との間の1つまたは複数の境界を決定することを特徴とする方法。
IPC (1件):
FI (1件):
引用特許: