特許
J-GLOBAL ID:202003021142706017

音源分離装置、音源分離方法、およびプログラム

発明者:
出願人/特許権者:
代理人 (4件): 田▲崎▼ 聡 ,  鈴木 慎吾 ,  酒井 太一 ,  渡辺 伸一
公報種別:公開公報
出願番号(国際出願番号):特願2019-034713
公開番号(公開出願番号):特開2020-140041
出願日: 2019年02月27日
公開日(公表日): 2020年09月03日
要約:
【課題】複数の音源の音が混合されたモノラル音源から音源を従来より精度良く分離することができる音源分離装置、音源分離方法、およびプログラムを提供することを目的とする。【解決手段】音源分離装置は、複数の音源による混合音を含む音響信号を取得する信号取得部と、複数の音源のうち少なくとも1つの音源に対する立ち上がりのタイミングを示す立ち上がり情報を取得する立ち上がり情報取得部と、立ち上がり情報に基づいて、アクティベーションに対してマルコフ連鎖によって音源の存在を0と1の変数で制御するバイナリマスクを設定し、設定したバイナリマスクを用いて音響信号から生成したスペクトログラムを非負値行列因子分解により基底スペクトルとアクティベーションに分解することで音響信号の中から特定の音源を分離する音源分離部と、を備える。【選択図】図1
請求項(抜粋):
音響信号から生成したスペクトログラムを非負値行列因子分解により基底スペクトルとアクティベーションに分解することで音響信号の中から特定の音源を分離する音源分離装置であって、 複数の音源による混合音を含む前記音響信号を取得する信号取得部と、 前記複数の音源のうち少なくとも1つの音源に対する立ち上がりのタイミングを示す立ち上がり情報を取得する立ち上がり情報取得部と、 前記立ち上がり情報に基づいて、前記アクティベーションHに対してマルコフ連鎖によって前記音源の存在を0と1の変数で制御するバイナリマスクSを設定し、設定した前記バイナリマスクSを用いて前記音響信号から生成したスペクトログラムXを非負値行列因子分解により前記基底スペクトルWと前記アクティベーションHに分解することで前記音響信号の中から特定の音源を分離する音源分離部と、 を備える音源分離装置。
IPC (1件):
G10L 21/028
FI (1件):
G10L21/028 C
引用特許:
出願人引用 (1件)
  • 音響解析装置
    公報種別:公開公報   出願番号:特願2013-002986   出願人:ヤマハ株式会社
審査官引用 (1件)
  • 音響解析装置
    公報種別:公開公報   出願番号:特願2013-002986   出願人:ヤマハ株式会社
引用文献:
出願人引用 (1件)
  • Score-Informed Source Separation for Musical Audio Recordings: An overview
審査官引用 (1件)
  • Score-Informed Source Separation for Musical Audio Recordings: An overview

前のページに戻る