特許
J-GLOBAL ID:200903073079484280
モデル更新を伴う話者認識方法及びその装置
発明者:
,
出願人/特許権者:
代理人 (1件):
草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平8-004509
公開番号(公開出願番号):特開平9-198084
出願日: 1996年01月16日
公開日(公表日): 1997年07月31日
要約:
【要約】【課題】 少いメモリ容量、計算量で長期にわたり高い認識精度を保持する。【解決手段】 音声が入力されると(S1 )、ケプストラムのような音声の特徴パラメータの時系列に変換され(S2 )、2〜3ケ月に1度モデル更新指示がなされるが、更新指示がなされていると(S3 )、その入力音声の特徴パラメータ列と対応HMMとの尤度f(X|θ)(θ:HMMのパラメータ)とその話者のθについての事前確率密度関数g(θ)と積が最大となるθを求め、つまりベイズ推定に基づき推定し(S6 )、その推定したθを、対応話者のHMMを更新する(S7 )。
請求項(抜粋):
入力音声を、特徴パラメータを用いた表現形式に変換し、その表現形式による入力音声と、予め話者対応に登録された上記表現形式による音声のモデルとの類似度を求めて、上記入力音声を発声した話声を認識し、上記各話者に対応するモデルを隠れマルコフモデル(Hidden Markor Model:以下HMMと記す)で表現した話者認識方法において、上記話者のHMMをベイズ推定に基づいて周期的に更新することを特徴とするモデル更新を伴う話者認識方法。
IPC (4件):
G10L 3/00 535
, G10L 3/00 521
, G10L 3/00
, G10L 3/00 531
FI (4件):
G10L 3/00 535
, G10L 3/00 521 F
, G10L 3/00 521 P
, G10L 3/00 531 F
前のページに戻る