特許
J-GLOBAL ID:200903000785040061
音声認識信頼度推定装置、その方法、およびプログラム
発明者:
,
,
,
出願人/特許権者:
代理人 (3件):
中尾 直樹
, 草野 卓
, 中村 幸雄
公報種別:公開公報
出願番号(国際出願番号):特願2006-059216
公開番号(公開出願番号):特開2007-240589
出願日: 2006年03月06日
公開日(公表日): 2007年09月20日
要約:
【課題】単語や音節などの短区間よりも発話や文単位などの長区間での認識結果の信頼度を求める。【解決手段】音声認識部6で、発話ごとの単語系列50への分割のほか、各単語の品詞情報52、音響尤度スコア54、言語尤度スコア55、単語尤度スコア56、単語継続時間長58、音素数60、音素継続時間長62を各単語に付与して、情報変換部20で、54、55、56、58、60、62の発話単位での平均値、分散値などの各統計値と品詞情報52を用いたクラス分けによる判定値を要素とする発話単位ごとの発話特徴量ベクトルに変換し、信頼度付与部22で、上記ベクトルと予め学習により求めた識別モデルを用いて推定された認識度に基いて信頼度を求める。【選択図】図1
請求項(抜粋):
入力されたディジタル音声信号を発話単位に分割し、その発話単位のディジタル音声信号から音響特徴パラメータを抽出し、その音響特徴パラメータに対し、与えられた言語的制約のもとで、言語的単位の各カテゴリの特徴を表現した確率モデルに出力する確率に基づくスコアを計算し、少なくとも、最も高いスコアを示すモデルが表現するカテゴリを認識し、上記発話ごとの単語系列を求め、かつその単語系列中の各単語ごとの上記認識に基づく情報を付与した単語系列を生成する音声認識部と、
上記分割された発話単位ごとに、その単語系列に含まれる各単語単位の上記認識に基づく情報を発話単位の発話特徴量ベクトル情報に変換する情報変換部と、
上記発話単位の発話特徴量ベクトル情報と識別モデルを用いて認識率を推定し、その推定した認識率に基いて、当該発話単位の情報の基となる発話音声認識結果に対する信頼度を求める信頼度付与部と
上記信頼度を出力する出力部と、
を備えることを特徴とする音声認識信頼度推定装置。
IPC (2件):
FI (2件):
G10L15/18 300G
, G10L15/10 300F
Fターム (2件):
引用特許:
引用文献:
前のページに戻る