特許
J-GLOBAL ID:201803021285887634
音声処理装置、音声処理方法及び音声処理プログラム
発明者:
,
出願人/特許権者:
代理人 (5件):
志賀 正武
, 佐伯 義文
, 寺本 光生
, 鈴木 三義
, 鈴木 慎吾
公報種別:公開公報
出願番号(国際出願番号):特願2016-164608
公開番号(公開出願番号):特開2018-031909
出願日: 2016年08月25日
公開日(公表日): 2018年03月01日
要約:
【課題】音響環境の変化によらず音声認識精度を確保できる音声処理装置、音声処理方法及び音声処理プログラムを提供する。【解決手段】分離部は複数チャネルの音声信号を到来方向毎の到来成分に分離し、分離部が分離した到来成分の到来方向に対応する統計量を所定の統計量と音声認識モデルを到来方向毎に記憶した記憶部から選択し、更新部は選択部が選択した統計量に基づいて音声認識モデルを更新し、音声認識部は音声認識モデルを用いて分離された到来成分の音声を認識する。【選択図】図1
請求項(抜粋):
複数チャネルの音声信号を到来方向毎の到来成分に分離する分離部と、
所定の統計量と音声認識モデルを到来方向毎に記憶した記憶部と、
前記分離部が分離した到来成分の到来方向に対応する統計量を前記記憶部から選択する選択部と、
前記選択部が選択した統計量に基づいて前記音声認識モデルを更新する更新部と、
前記音声認識モデルを用いて、前記到来成分の音声を認識する音声認識部と、
を備える音声処理装置。
IPC (4件):
G10L 15/06
, G10L 15/065
, G10L 15/20
, G10L 15/14
FI (4件):
G10L15/06 400V
, G10L15/065 Z
, G10L15/20 370Z
, G10L15/14 200Z
引用特許:
引用文献:
審査官引用 (1件)
-
Variance compensation within the MLLR framefork for robust speech recognition and speaker adaptation
前のページに戻る