Pat
J-GLOBAL ID:201103050491033917

音声認識装置、および音声認識方法、並びにプログラム

Inventor:
Applicant, Patent owner:
Agent (5): 宮田 正昭 ,  山田 英治 ,  澤田 俊夫 ,  佐々木 榮二 ,  特許業務法人大同特許事務所
Gazette classification:公開公報
Application number (International application number):2009265076
Publication number (International publication number):2011107603
Application date: Nov. 20, 2009
Publication date: Jun. 02, 2011
Summary:
【課題】複数音源からの混合信号に対する音源分離と音声認識を実行し、必要とする認識結果を効率的に取得する装置、方法を提供する。【解決手段】複数音源からの出力を混合した混合信号からなる観測信号に対して、独立成分分析(ICA)を適用した処理により分離信号を生成するとともに、各分離信号に対する音声認識処理を実行する。さらに音声認識結果の評価情報としての付加情報を生成する。付加情報として音声認識結果の認識信頼度や、音声認識結果が音声認識装置において想定したタスクに関連する認識結果であるか否かを示すタスク内発話度を算出する。これらの付加情報を適用して各チャンネル対応の音声認識結果のスコアを算出してスコアの高い認識結果を選択出力する。【選択図】図3
Claim (excerpt):
複数音源の出力の混合信号を各音源に対応する信号に分離して複数チャンネルの分離信号を生成する音源分離部と、 前記音源分離部の生成した複数チャンネルの分離信号を入力して音声認識処理を実行し、各チャンネル対応の音声認識結果を生成するとともに、各チャンネル対応の音声認識結果の評価情報となる付加情報を生成する音声認識部と、 前記音声認識結果と前記付加情報を入力し、前記付加情報を適用して各チャンネル対応の音声認識結果のスコアを算出し、スコアの高い音声認識結果を選択出力するチャンネル選択部を有する音声認識装置。
IPC (4):
G10L 15/28 ,  G10L 15/20 ,  G10L 21/02 ,  G10L 15/22
FI (4):
G10L15/28 220Z ,  G10L15/20 370E ,  G10L21/02 201D ,  G10L15/22 453
F-Term (1):
5D015EE05

Return to Previous Page