特許
J-GLOBAL ID:201403088288799164
音声認識装置、音声認識方法、およびプログラム
発明者:
,
,
出願人/特許権者:
代理人 (3件):
中尾 直樹
, 中村 幸雄
, 義村 宗洋
公報種別:公開公報
出願番号(国際出願番号):特願2012-163527
公開番号(公開出願番号):特開2014-025955
出願日: 2012年07月24日
公開日(公表日): 2014年02月06日
要約:
【課題】認識精度を向上する。【解決手段】音声認識装置10は複数の話者を事前にグループ分けした一方のグループに属する第一話者と他方のグループに属する第二話者との会話音声を認識する。第1認識処理部130Aは音響モデルと言語モデルとを用いて第一話者の音声を認識する。翻訳トピックモデル生成部140は対話コーパスから翻訳トピックモデルを求める。単語生起確率算出部150は第一話者音声の認識結果と翻訳トピックモデルとを用いて第二話者の単語生起確率を算出する。言語モデル適応部160は単語生起確率を用いて言語モデルから適応言語モデルを求める。第2認識処理部130Bは音響モデルと適応言語モデルとを用いて第二話者の音声を認識する。【選択図】図1
請求項(抜粋):
複数の話者を事前にグループ分けし、一方のグループに属する第一話者と他方のグループに属する第二話者との会話音声を認識する音声認識装置であって、
前記一方のグループに属する話者と前記他方のグループに属する話者との会話音声を書き起こした対話コーパスを記憶する対話コーパス記憶部と、
言語モデルを記憶する言語モデル記憶部と、
音響モデルを記憶する音響モデル記憶部と、
前記音響モデルと前記言語モデルとを用いて、前記第一話者の音声を認識して第一話者認識結果を求める第1認識処理部と、
前記対話コーパスから前記第一話者の発話内容を前記第二話者の発話内容に変換する翻訳トピックモデルを求める翻訳トピックモデル生成部と、
前記第一話者認識結果と前記翻訳トピックモデルとを用いて、前記第二話者の単語生起確率を算出する単語生起確率算出部と、
前記単語生起確率を用いて、前記言語モデルから適応言語モデルを求める言語モデル適応部と、
前記音響モデルと前記適応言語モデルとを用いて、前記第二話者の音声を認識して第二話者認識結果を求める第2認識処理部と、
を備えることを特徴とする音声認識装置。
IPC (2件):
G10L 15/065
, G10L 15/183
FI (2件):
G10L15/06 310Z
, G10L15/18 200Z
引用特許:
引用文献: