特許
J-GLOBAL ID:201003089712108859

音声認識装置及び音声認識装置のマスク生成方法

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人オカダ・フシミ・ヒラノ
公報種別:公開公報
出願番号(国際出願番号):特願2009-185164
公開番号(公開出願番号):特開2010-049249
出願日: 2009年08月07日
公開日(公表日): 2010年03月04日
要約:
【課題】複数音源の音声を同時認識する音声認識に適したソフトマスクを備え、音声認識率の向上を図る。【解決手段】音声認識装置は、複数音源からの混合音を分離する音源分離部101と、前記音源分離部が分離を行った際の分離信頼度に対応して、分離された音声ごとに、0から1の間の連続的な値をとりうるソフトマスクを生成するマスク生成部103と、前記音源分離部によって分離された音声を、前記マスク生成部で生成されたソフトマスクを使用して認識する音声認識部105と、を備えている。【選択図】図1
請求項(抜粋):
複数音源からの混合音を分離する音源分離部と、 前記音源分離部が分離を行った際の分離信頼度に対応して、分離された音声ごとに、0から1の間の連続的な値をとりうるソフトマスクを生成するマスク生成部と、 前記音源分離部によって分離された音声を、前記マスク生成部で生成されたソフトマスクを使用して認識する音声認識部と、を備えた音声認識装置。
IPC (2件):
G10L 15/20 ,  G10L 15/10
FI (2件):
G10L15/20 353 ,  G10L15/10 300G
Fターム (2件):
5D015EE00 ,  5D015HH05
引用文献:
前のページに戻る