特許
J-GLOBAL ID:200903035307472949

音声認識装置、音声認識方法、および、音声認識プログラム

発明者:
出願人/特許権者:
代理人 (1件): 机 昌彦 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2002-149746
公開番号(公開出願番号):特開2003-345388
出願日: 2002年05月23日
公開日(公表日): 2003年12月03日
要約:
【要約】【課題】 音声認識装置における認識誤りを低減する。【解決手段】 音声信号入力手段101は、音声信号を受け取り、認識結果候補生成手段102は、あらかじめ準備された音響モデル、および、単語辞書から、N個の単語列、N個の単語列それぞれに対応する単語継続時間長系列、および、N個のスコアを出力する。継続時間長正規化手段103が、発話速度に応じて1次関数で規定される写像によって、正規化定数計算手段105によって推定される1次関数写像を規定するパラメータに基づいて継続時間長を正規化する。認識結果候補修正手段104は、認識結果候補単語列の継続時間長の並びのもっともらしさに応じて認識結果の各候補のスコアを補正する。
請求項(抜粋):
外部から入力される音声信号を受け取る音声信号入力手段と、前記音声信号入力手段から音声信号を受け取り、あらかじめ準備された標準パタンのセット、および、文法に基づいて、音声信号に適合するスコアの高い単語列を上位から順に複数個求め、複数個の単語列、複数個の単語列それぞれに対応する単語継続時間長系列、および、複数個の単語列それぞれに対応するスコアを出力する認識結果候補生成手段と、前記認識結果候補生成手段から単語列、継続時間長系列およびスコアを受け取り、単語列、継続時間長から正規化定数を用いて継続時間長の正規化を行う継続時間長正規化手段と、前記認識結果候補生成手段の出力したスコアを継続時間長の平均、分散に基づいて補正し、出力する認識結果候補修正手段と、前記継続時間長正規化手段が継続時間長の正規化のために用いる正規化定数を継続時間長の平均、分散に基づいて計算する正規化定数計算手段と、前記認識結果候補修正手段がスコアを計算する際、および、前記正規化定数計算手段が正規化定数を計算する際に使用する継続時間長の平均、分散を格納する継続時間長統計量格納手段と、を備えることを特徴とする音声認識装置。
IPC (2件):
G10L 15/22 ,  G10L 15/14
FI (2件):
G10L 3/00 561 E ,  G10L 3/00 535 Z
Fターム (3件):
5D015CC15 ,  5D015GG01 ,  5D015LL01
引用特許:
審査官引用 (5件)
全件表示

前のページに戻る