特許
J-GLOBAL ID:200903093996150830
音信号処理方法及びその装置、音声認識装置並びにプログラム
発明者:
出願人/特許権者:
代理人 (3件):
森 哲也
, 内藤 嘉昭
, 崔 秀▲てつ▼
公報種別:公開公報
出願番号(国際出願番号):特願2004-035619
公開番号(公開出願番号):特開2005-227512
出願日: 2004年02月12日
公開日(公表日): 2005年08月25日
要約:
【課題】ブラインド音源分離をリアルタイムで行うことを可能にする。【解決手段】音声信号処理装置10は、話者音源101からの音声と雑音源102からの音との混合音が入力される第1及び第2マイク1,2と、話者音源101から出力された発話区間を検出する発話区間判定部11と、発話区間判定部11が発話区間を検出した場合、第1及び第2マイク1,2に入力された音声信号x1(t),x2(t)を用いて、分離行列を最適化する分離処理オン/オフ制御部12、最適化計算オン/オフ制御部13及び分離行列最適化計算部26と、分離行列最適化計算部26が最適化した分離行列を用いて、混合音から話者音源101からの音と雑音源102からの音とを分離する分離処理部25とを備える。【選択図】図2
請求項(抜粋):
検出対象音源からの音と雑音源からの音との混合音により分離行列を最適化していき、当該最適化した分離行列を用いて、前記混合音から検出対象音源からの音と雑音源からの音とを分離するブラインド音源分離(BBS:BlindSource Separation)を行う音信号処理方法において、
前記検出対象音源からの音の検出の有無により前記分離行列の最適化の実行を切換可能にするとともに、前記検出対象音源からの音を検出した場合、前記分離行列の最適化を行い、前記検出対象音源からの音を検出できない場合、前記分離行列の最適化を行わないことを特徴とする音信号処理方法。
IPC (8件):
G10L15/20
, G10L11/02
, G10L15/00
, G10L15/02
, G10L15/04
, G10L15/28
, G10L21/02
, H04R3/00
FI (8件):
G10L3/02 301Z
, H04R3/00 320
, G10L3/00 511
, G10L3/02 301E
, G10L3/00 513B
, G10L3/02 301F
, G10L3/00 551A
, G10L9/08 301A
Fターム (8件):
5D015AA06
, 5D015BB02
, 5D015CC17
, 5D015DD02
, 5D015EE05
, 5D015FF07
, 5D015KK02
, 5D020BB07
引用文献:
前のページに戻る