特許
J-GLOBAL ID:200903080105783271

話者認識装置

発明者:
出願人/特許権者:
代理人 (1件): 滝本 智之 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-010209
公開番号(公開出願番号):特開平11-212589
出願日: 1998年01月22日
公開日(公表日): 1999年08月06日
要約:
【要約】【課題】 登録話者の音声特徴を良く表現している符号帳のコードベクトルの量子化歪みを強調することにより登録話者の認識精度を向上できる話者認識装置を提供することを目的とする。【解決手段】 音声特徴スペクトルを算出するスペクトル分析部13と、音声特徴スペクトルに基づく音声特徴ベクトルにより発声話者の符号帳を作成する符号帳作成部14と、発声話者の音声特徴ベクトルを登録話者の符号帳で量子化する時の歪みを算出する量子化歪み算出部と、量子化歪みの値から話者認識結果を判定する認識結果判定部18とを有し、登録話者から発声話者の音声を認識した時、各コードベクトルの量子化歪を算出し、次回認識時に量子化歪みの小、大に応じてコードベクトルの重みづけを大、小として話者間距離の算出に用いる符号帳重み付け処理部17を備えた。
請求項(抜粋):
発声話者の発声を取り込む音声入力部と、前記音声入力部から入力されたアナログ音声信号をデジタル音声信号に変換するA/D変換部と、前記A/D変換部から出力されるデジタル音声信号に基づいて音声特徴スペクトルを算出するスペクトル分析部と、前記スペクトル分析部で算出された音声特徴スペクトルの集合をベクトル量子化して得られた音声特徴ベクトルにより発声話者の符号帳を作成する符号帳作成部と、前記符号帳作成部で得られた発声話者の音声特徴ベクトルを登録話者の符号帳で量子化する時の歪みを算出する量子化歪み算出部と、前記算出した量子化歪みの値から話者認識結果を判定する認識結果判定部とを有する話者認識装置であって、登録話者から発声話者の音声を認識した時、前記認識した音声特徴ベクトルを符号帳で量子化した各コードベクトルの量子化歪を算出しておき、次回の認識時には前記算出しておいた量子化歪みが小さかったコードベクトルの重みづけを大きく、前記算出しておいた量子化歪みが大きかったコードベクトルの重みづけを小さくして話者間距離の算出に用いる符号帳重み付け処理部を備えたことを特徴とする話者認識装置。
IPC (5件):
G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 515 ,  G10L 9/14 ,  G10L 9/18
FI (5件):
G10L 3/00 531 L ,  G10L 3/00 531 G ,  G10L 3/00 515 B ,  G10L 9/14 J ,  G10L 9/18 E

前のページに戻る