特許
J-GLOBAL ID:201003078902820596

音声を含む信号の処理方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 稲葉 滋
公報種別:公開公報
出願番号(国際出願番号):特願2009-054766
公開番号(公開出願番号):特開2010-210758
出願日: 2009年03月09日
公開日(公表日): 2010年09月24日
要約:
【課題】音声と非音声(楽器音、騒音)の混合信号が与えられたときに、その信号から音声成分のみを抽出し、もしくは非音声成分のみを抽出する。【解決手段】音声成分を含む音信号の長いフレーム長の時間周波数分解能の時間周波数平面上で周波数方向に滑らかなスペクトル成分を検出して、当該スペクトル成分を音声成分を含むスペクトル成分として抽出する処理と、音声成分を含む音信号の短いフレーム長の時間周波数分解能の時間周波数平面上で時間方向に滑らかなスペクトル成分を検出して、当該スペクトル成分を音声成分を含むスペクトル成分として抽出する処理と、を用いることで、音声成分を含む原信号において、音声成分以外のスペクトル成分を抑圧して音声成分を抽出ないし強調する。【選択図】図7
請求項(抜粋):
音声を含む音信号の第1のフレーム長の時間周波数分解能のスペクトログラムWlongにおいて、時間周波数平面上で周波数方向に滑らかなスペクトル成分を、音声成分を含むスペクトル成分としてスペクトログラムWlongにおける他のスペクトル成分から分離する処理と、 音声を含む音信号の第2のフレーム長の時間周波数分解能のスペクトログラムWshortにおいて、時間周波数平面上で時間方向に滑らかなスペクトル成分を、音声成分を含むスペクトル成分としてスペクトログラムWshortにおける他のスペクトル成分から分離する処理と、 を用いることで、音声を含む原信号において、前記分離された音声成分を含むスペクトル成分、前記他のスペクトル成分、の少なくとも一部を用いて、音声成分あるいは非音声成分を抽出する、音信号の処理方法。 ここで、 第1のフレーム長は、音声のスペクトル成分が時間周波数平面上で周波数方向に滑らかとなる程度に長いフレーム長であり、 第2のフレーム長は、音声のスペクトル成分が時間周波数平面上で時間方向に滑らかとなる程度に短いフレーム長である。
IPC (2件):
G10L 11/00 ,  G10K 15/04
FI (3件):
G10L11/00 402L ,  G10L11/00 101G ,  G10K15/04 302D
Fターム (1件):
5D108BF20
引用文献:
審査官引用 (2件)
  • スペクトログラムの滑らかさの異方性に基づいた調波音・打楽器音の分離
  • スペクトログラムの滑らかさの異方性に基づいた調波音・打楽器音の分離

前のページに戻る