特許
J-GLOBAL ID:201503084234485638

音声認識装置、音声認識方法及びプログラム

発明者:
出願人/特許権者:
代理人 (3件): 中尾 直樹 ,  中村 幸雄 ,  義村 宗洋
公報種別:公開公報
出願番号(国際出願番号):特願2013-127389
公開番号(公開出願番号):特開2015-001695
出願日: 2013年06月18日
公開日(公表日): 2015年01月05日
要約:
【課題】潜在語言語モデルを用いた音声認識を高速に行う。【解決手段】潜在語言語モデル記憶部14は、観測語系列に対応する学習潜在語系列の確率分布並びに観測語及び潜在語の確率分布を学習した潜在語言語モデルを記憶する。ベースライン言語モデル記憶部18は、潜在語系列の確率分布及び観測語系列の確率分布を混合したベースライン言語モデルを記憶する。複数仮説生成部20は、ベースライン言語モデルを用いて入力音声を音声認識し、複数の音声認識結果の仮説及び仮音声認識スコアを生成する。潜在語系列決定部22は、潜在語言語モデルを用いて仮説潜在語系列を決定し、仮説及び仮説潜在語系列の同時確率を求める。スコア再計算部24は、仮音声認識スコア及び同時確率を用いて音声認識スコアを求める。一位仮説決定部26は、複数の仮説から音声認識スコアに基づいて音声認識結果を決定する。【選択図】図2
請求項(抜粋):
学習テキストに含まれる観測語系列に対応する潜在語系列である学習潜在語系列の確率分布並びに上記観測語系列中の観測語及び上記潜在語系列中の潜在語の確率分布を学習した潜在語言語モデルを記憶する潜在語言語モデル記憶部と、 上記潜在語言語モデルに含まれる潜在語系列の確率分布及び上記観測語系列の確率分布を混合したベースライン言語モデルを記憶するベースライン言語モデル記憶部と、 上記ベースライン言語モデルを用いて入力音声を音声認識し、複数の音声認識結果の仮説及び各仮説に対する仮音声認識スコアを生成する複数仮説生成部と、 上記潜在語言語モデルを用いて上記仮説に対応する潜在語系列である仮説潜在語系列を決定し、上記仮説及び上記仮説潜在語系列の同時確率を求める潜在語系列決定部と、 上記仮音声認識スコア及び上記同時確率を用いて音声認識スコアを求めるスコア再計算部と、 上記複数の仮説から上記音声認識スコアに基づいて上記入力音声に対する音声認識結果を決定する一位仮説決定部と、 を含む音声認識装置。
IPC (5件):
G10L 15/183 ,  G10L 15/187 ,  G10L 15/197 ,  G10L 15/18 ,  G10L 15/08
FI (4件):
G10L15/18 200Z ,  G10L15/18 200D ,  G10L15/18 300G ,  G10L15/08 200Z

前のページに戻る