特許
J-GLOBAL ID:201103012785157658

バレーパーセンテージを使用した純粋音声の検出

発明者:
出願人/特許権者:
代理人 (4件): 濱中 淳宏 ,  勝本 龍二 ,  谷 義一 ,  阿部 和夫
公報種別:特許公報
出願番号(国際出願番号):特願2000-585861
特許番号:特許第4652575号
出願日: 1999年11月30日
請求項(抜粋):
【請求項1】純粋音声信号および非音声信号または混合音声信号を有するオーディオ信号を入力したコンピュータにおいて、前記オーディオ信号から純粋音声信号を検出する方法であって、前記コンピュータの処理装置は、 前記コンピュータに入力された前記オーディオ信号を離散的なオーディオ標本のストリームに変換し、 前記オーディオ信号からウィンドウを用いてバレーパーセンテージを計算し、前記バレーパーセンテージの計算は、前記ストリームの所与のオーディオ標本に対し、 前記ウィンドウを通して見える、前記所与のオーディオ標本の周囲の複数のオーディオ標本に対するしきい値エネルギーレベルを決定することと、 低エネルギー成分である前記所与のオーディオ標本の周囲の複数のオーディオ標本の割合に基づいて、前記所与のオーディオ標本において、前記バレーパーセンテージを決定することであって、前記低エネルギー成分は、前記所与のオーディオ標本の周囲の前記複数のオーディオ標本に対する前記しきい値エネルギーレベルよりも低いエネルギーレベルを有することと を含み、 前記バレーパーセンテージをバレーパーセンテージしきい値と比較して、前記所与のオーディオ標本および前記ストリームの1つまたは複数の他のオーディオ標本を純粋音声区分または非音声区分に分類し、 前記オーディオ信号の純粋音声として分類された部分と前記オーディオ信号の非音声として分類された部分との間の1つまたは複数の境界を決定することを特徴とする方法。
IPC (1件):
G10L 15/04 ( 200 6.01)
FI (1件):
G10L 15/04 300 B
引用特許:
出願人引用 (3件) 審査官引用 (4件)
全件表示

前のページに戻る