特許
J-GLOBAL ID:200903038621418788

音声認識装置及びコンピュータプログラム

発明者:
出願人/特許権者:
代理人 (1件): 清水 敏
公報種別:公開公報
出願番号(国際出願番号):特願2003-317559
公開番号(公開出願番号):特開2005-084436
出願日: 2003年09月09日
公開日(公表日): 2005年03月31日
要約:
【課題】あるモデルによる音声認識の誤りを、他のモデルによる音声認識結果で置換する際に、最終的な音声認識の精度を高める。【解決手段】音声認識装置は、N-グラムモデルを用いて音声認識を行ない、N-グラム候補44及び信頼度尺度を出力する音声認識部40、音声認識部40からのN-グラム候補44に対し、正誤を判別するように最適化された予備判別部46、予備判別部46が誤りと判定した箇所について、用例文モデルを用いて音声認識を行ない、用例文候補52と信頼度を算出する用例候補選択部50、N-グラム候補44を用例文候補52で置換するか否かを判別し最終の音声認識結果28を出力する最終判別部54とを含み、予備判別部46は、学習により得られた判別基準より多くの誤りを検出するようにバイアスした判別基準を用いて判別する。【選択図】 図1
請求項(抜粋):
音声認識のための予め定める第1のモデルを用いて入力音声に対する音声認識を行ない、認識結果及びその信頼度尺度を出力するための第1の音声認識手段と、 前記第1の音声認識手段により出力された認識結果の各々に対し、前記信頼度尺度を用いた学習により正誤を判別するように予め最適化された第1の判別手段と、 前記入力音声に対して前記第1の判別手段が誤りと判定した箇所について、前記第1のモデルと異なる予め定める第2のモデルを用いて音声認識を行ない、認識結果及びその信頼度を算出するための第2の音声認識手段と、 前記第1の音声認識手段により出力された認識結果の各々に対し、前記第1の音声認識手段の出力する前記信頼度尺度及び前記第2の音声認識手段の出力する前記信頼度を用いた学習により、前記第1の音声認識手段の認識結果を前記第2の音声認識手段の認識結果で置換するか否かを判別し、判別結果にしたがって最終の音声認識結果を出力するように最適化された第2の判別手段とを含み、 前記第1の判別手段は、前記第1の音声認識手段により出力された認識結果の各々に対し、前記信頼度尺度を用いた学習により得られた正誤の判別基準に基づき、より多くの誤りを検出するようにバイアスした判別基準を用いて判別する、音声認識装置。
IPC (4件):
G10L15/18 ,  G10L15/16 ,  G10L15/22 ,  G10L15/28
FI (6件):
G10L3/00 537J ,  G10L3/00 537D ,  G10L3/00 537G ,  G10L3/00 539 ,  G10L3/00 561B ,  G10L3/00 561E
Fターム (1件):
5D015LL10

前のページに戻る