特許
J-GLOBAL ID:200903001680200450

音声認識装置及びHMM発音モデルをトレーニングする方法

発明者:
出願人/特許権者:
代理人 (1件): 清水 敏
公報種別:公開公報
出願番号(国際出願番号):特願2004-046988
公開番号(公開出願番号):特開2005-234504
出願日: 2004年02月23日
公開日(公表日): 2005年09月02日
要約:
【課題】 発音の変異に効果的に対処できる音声認識装置を提供する。【解決手段】 装置42は、入力発話40の1-ベスト音素シーケンスを出力するユニットと、発話40のN-ベスト認識仮説をそれぞれの音響スコアとともに出力するユニット142と、1-ベスト音素シーケンスを再スコアされるべき仮説に従って選択された単語ベースの離散発音モデル34に適用することにより、N-ベスト仮説の各々を再スコアする再スコアユニット144と、最も高いスコアを達成した仮説を選択するための選択ユニット148とを含む。【選択図】 図5
請求項(抜粋):
入力音声データの音素を認識して入力音声データの音素ラベルのシーケンスを出力するための手段と、 入力音声データ中の単語を認識して複数個の認識単語のシーケンスをそれぞれの音響スコアと共に出力するための手段と、 再スコアされるべき認識単語のシーケンスに従って選択された発音モデルに前記音素ラベルのシーケンスを適用することにより、前記複数個の認識単語のシーケンスの各々を再スコアするための手段とを含み、前記発音モデルはトレーニングデータセット内の単語とそれらの音素との多数の対を用いてトレーニングされており、さらに 前記複数個の認識単語のシーケンスのうち、前記再スコア手段によって予め定められた条件を満たすスコアが与えられたものを選択するための手段を含む、音声認識装置。
IPC (3件):
G10L15/28 ,  G10L15/06 ,  G10L15/14
FI (3件):
G10L5/06 D ,  G10L3/00 535Z ,  G10L3/00 521F
Fターム (2件):
5D015FF07 ,  5D015HH12
引用特許:
出願人引用 (2件) 審査官引用 (2件)
引用文献:
前のページに戻る