特許
J-GLOBAL ID:200903025745956643

音声認識誤り分析装置、方法、プログラム及びその記録媒体

発明者:
出願人/特許権者:
代理人 (3件): 中尾 直樹 ,  草野 卓 ,  中村 幸雄
公報種別:公開公報
出願番号(国際出願番号):特願2008-038469
公開番号(公開出願番号):特開2009-198647
出願日: 2008年02月20日
公開日(公表日): 2009年09月03日
要約:
【課題】言語モデルにおいて認識誤りを起こしやすい部分を特定する。【解決手段】言語モデルを用いて音声信号に対して音声認識処理を行い、その音声認識結果である認識単語列を割り当てる。認識単語列内の、その認識単語列に対応する正解単語列と一致しない1つ又は連続する複数の単語から構成される認識誤り単語列を認識単語列から抽出する。認識誤り単語列内の連続する2つの単語の組である区間内誤り二単語組のすべてを認識誤り単語列から抽出する。区間内誤り二単語組の1つ目の単語と、その1つ目の単語の始端よりも時間的に後にあり、その1つ目の単語の終端に時間的に最も近い始端を有する正解単語列内の単語とから構成される正解復帰二単語組を各区間内誤り二単語組ごとに抽出する。正解復帰二単語組の単語連鎖確率よりも単語連鎖確率が高い高区間内誤り二単語組を抽出する。【選択図】図1
請求項(抜粋):
言語モデルを用いて音声信号に対して音声認識処理を行い、その音声認識結果である単語列(以下、認識単語列とする。)を割り当てる音声認識部と、 認識単語列内の、その認識単語列に対応する正解単語列と一致しない1つ又は連続する複数の単語から構成される単語列(以下、認識誤り単語列とする。)を上記認識単語列から抽出する認識誤り単語列抽出部と、 認識誤り単語列内の連続する2つの単語の組(以下、区間内誤り二単語組とする。)のすべてを上記認識誤り単語列から抽出する区間内誤り二単語組抽出部と、 区間内誤り二単語組の1つ目の単語と、その1つ目の単語の始端よりも時間的に後にあり、その1つ目の単語の終端に時間的に最も近い始端を有する上記正解単語列内の単語とから構成される正解復帰二単語組を各上記区間内誤り二単語組ごとに抽出する正解復帰二単語組抽出部と、 上記言語モデルを用いて、上記区間内誤り二単語組の単語連鎖確率と上記正解復帰二単語組の単語連鎖確率をそれぞれ計算する区間内単語連鎖確率計算部と、 上記区間内誤り二単語組の単語連鎖確率と、その区間内誤り二単語組に対応する正解復帰二単語組の単語連鎖確率とを比較して、上記正解復帰二単語組の単語連鎖確率よりも単語連鎖確率が高い区間内誤り二単語組(以下、高区間内誤り二単語組とする。)を抽出する高区間内誤り二単語組抽出部と、 を備える音声認識誤り分析装置。
IPC (2件):
G10L 15/18 ,  G10L 15/22
FI (2件):
G10L15/18 200Z ,  G10L15/22 470Z
Fターム (2件):
5D015AA01 ,  5D015LL04

前のページに戻る