音声認識装置、音声認識方法、およびプログラム

発明者： , ,
出願人/特許権者：
代理人 (3件)：中尾直樹 , 中村幸雄 , 義村宗洋
公報種別：公開公報
出願番号（国際出願番号）：特願2012-163527
公開番号（公開出願番号）：特開2014-025955
出願日： 2012年07月24日
公開日（公表日）： 2014年02月06日
要約：

【課題】認識精度を向上する。【解決手段】音声認識装置10は複数の話者を事前にグループ分けした一方のグループに属する第一話者と他方のグループに属する第二話者との会話音声を認識する。第1認識処理部130Aは音響モデルと言語モデルとを用いて第一話者の音声を認識する。翻訳トピックモデル生成部140は対話コーパスから翻訳トピックモデルを求める。単語生起確率算出部150は第一話者音声の認識結果と翻訳トピックモデルとを用いて第二話者の単語生起確率を算出する。言語モデル適応部160は単語生起確率を用いて言語モデルから適応言語モデルを求める。第2認識処理部130Bは音響モデルと適応言語モデルとを用いて第二話者の音声を認識する。【選択図】図1

請求項（抜粋）：

複数の話者を事前にグループ分けし、一方のグループに属する第一話者と他方のグループに属する第二話者との会話音声を認識する音声認識装置であって、前記一方のグループに属する話者と前記他方のグループに属する話者との会話音声を書き起こした対話コーパスを記憶する対話コーパス記憶部と、言語モデルを記憶する言語モデル記憶部と、音響モデルを記憶する音響モデル記憶部と、前記音響モデルと前記言語モデルとを用いて、前記第一話者の音声を認識して第一話者認識結果を求める第1認識処理部と、前記対話コーパスから前記第一話者の発話内容を前記第二話者の発話内容に変換する翻訳トピックモデルを求める翻訳トピックモデル生成部と、前記第一話者認識結果と前記翻訳トピックモデルとを用いて、前記第二話者の単語生起確率を算出する単語生起確率算出部と、前記単語生起確率を用いて、前記言語モデルから適応言語モデルを求める言語モデル適応部と、前記音響モデルと前記適応言語モデルとを用いて、前記第二話者の音声を認識して第二話者認識結果を求める第2認識処理部と、を備えることを特徴とする音声認識装置。

IPC (2件)：

G10L 15/065 , G10L 15/183

FI (2件)：

G10L15/06 310Z , G10L15/18 200Z

引用特許：

出願人引用 (3件)

音声認識装置、音声認識方法及び音声認識プログラム
公報種別：公開公報出願番号：特願2009-260836 出願人：日本電信電話株式会社
音声認識装置
公報種別：公開公報出願番号：特願2003-153121 出願人：三菱電機株式会社
音声認識装置及び音声認識プログラム
公報種別：公開公報出願番号：特願2006-049729 出願人：日本放送協会

審査官引用 (3件)

音声認識装置、音声認識方法及び音声認識プログラム
公報種別：公開公報出願番号：特願2009-260836 出願人：日本電信電話株式会社
音声認識装置
公報種別：公開公報出願番号：特願2003-153121 出願人：三菱電機株式会社
音声認識装置及び音声認識プログラム
公報種別：公開公報出願番号：特願2006-049729 出願人：日本放送協会

引用文献：

出願人引用 (4件)

"スライド情報を用いた言語モデル適応による講義音声認識"
"能動的情報収集の履歴を用いた雑談音声認識の言語モデル適応"
"話題と話者に関するPLSAに基づく言語モデル適応"

全件表示

審査官引用 (4件)

"スライド情報を用いた言語モデル適応による講義音声認識"
"能動的情報収集の履歴を用いた雑談音声認識の言語モデル適応"
"話題と話者に関するPLSAに基づく言語モデル適応"

全件表示

前のページに戻る