特許
J-GLOBAL ID:201103050491033917
音声認識装置、および音声認識方法、並びにプログラム
発明者:
,
,
,
,
出願人/特許権者:
代理人 (5件):
宮田 正昭
, 山田 英治
, 澤田 俊夫
, 佐々木 榮二
, 特許業務法人大同特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2009-265076
公開番号(公開出願番号):特開2011-107603
出願日: 2009年11月20日
公開日(公表日): 2011年06月02日
要約:
【課題】複数音源からの混合信号に対する音源分離と音声認識を実行し、必要とする認識結果を効率的に取得する装置、方法を提供する。【解決手段】複数音源からの出力を混合した混合信号からなる観測信号に対して、独立成分分析(ICA)を適用した処理により分離信号を生成するとともに、各分離信号に対する音声認識処理を実行する。さらに音声認識結果の評価情報としての付加情報を生成する。付加情報として音声認識結果の認識信頼度や、音声認識結果が音声認識装置において想定したタスクに関連する認識結果であるか否かを示すタスク内発話度を算出する。これらの付加情報を適用して各チャンネル対応の音声認識結果のスコアを算出してスコアの高い認識結果を選択出力する。【選択図】図3
請求項(抜粋):
複数音源の出力の混合信号を各音源に対応する信号に分離して複数チャンネルの分離信号を生成する音源分離部と、
前記音源分離部の生成した複数チャンネルの分離信号を入力して音声認識処理を実行し、各チャンネル対応の音声認識結果を生成するとともに、各チャンネル対応の音声認識結果の評価情報となる付加情報を生成する音声認識部と、
前記音声認識結果と前記付加情報を入力し、前記付加情報を適用して各チャンネル対応の音声認識結果のスコアを算出し、スコアの高い音声認識結果を選択出力するチャンネル選択部を有する音声認識装置。
IPC (4件):
G10L 15/28
, G10L 15/20
, G10L 21/02
, G10L 15/22
FI (4件):
G10L15/28 220Z
, G10L15/20 370E
, G10L21/02 201D
, G10L15/22 453
Fターム (1件):
前のページに戻る