Pat
J-GLOBAL ID:200903019737449660

話者認識装置、プログラム及び話者認識方法

Inventor:
Applicant, Patent owner:
Agent (3): 柏木 慎史 ,  小山 尚人 ,  柏木 明
Gazette classification:公開公報
Application number (International application number):2004164346
Publication number (International publication number):2005345683
Application date: Jun. 02, 2004
Publication date: Dec. 15, 2005
Summary:
【課題】 話者認識において、精度が高い話者認識を実現することである。【解決手段】 話者間距離計算部11により、認識対象話者の音声から生成された音声特徴ベクトル列の各音声特徴ベクトルとコードブックの各代表ベクトルとの量子化距離に基づいて、音声特徴ベクトル列の低次の音声特徴ベクトル群を用いて歪み距離に基づいて各音声特徴ベクトルが量子化され、音声特徴ベクトル列の高次の音声特徴ベクトル群を用いて量子化歪が求められ、同定部12により、その量子化歪、例えば量子化歪の平均値に基づいて話者の同定が行われる。これにより、音韻分解性能と話者分解性能とのトレードオフの関係が解消され、音韻分解性能と話者分解性能とを両立させることが可能となるため、精度が高い話者認識を実現することができる。【選択図】 図3
Claim (excerpt):
登録対象話者の音声から生成された第1音声特徴ベクトル列と認識対象話者の音声から生成された第2音声特徴ベクトル列とを用いて話者の認識を行う話者認識装置において、 前記第1音声特徴ベクトル列の低次の音声特徴ベクトル群を用いて各音声特徴ベクトル間のベクトル間距離を求め、求めたベクトル間距離に基づいて前記第1音声特徴ベクトル列をクラスタ化し、複数の代表ベクトルからなるコードブックを生成する手段と、 生成した前記コードブックを記憶する手段と、 記憶されている前記コードブックの複数の代表ベクトルと前記第2音声特徴ベクトル列の各音声特徴ベクトルの低次の音声特徴ベクトル群とを用いて各音声特徴ベクトル間の量子化距離を求め、求めた量子化距離に基づいて前記第2音声特徴ベクトル列の各音声特徴ベクトルを量子化し、記憶されている前記コードブックの複数の代表ベクトルと前記第2音声特徴ベクトル列の各音声特徴ベクトルの高次の音声特徴ベクトル群とを用いて量子化歪を求める手段と、 求めた前記量子化歪に基づいて話者の同定を行う手段と、 を備えることを特徴とする話者認識装置。
IPC (3):
G10L17/00 ,  G10L15/02 ,  G10L15/10
FI (3):
G10L3/00 545A ,  G10L3/00 515B ,  G10L3/00 531G
F-Term (1):
5D015AA03
Patent cited by the Patent:
Cited by examiner (4)
Show all
Article cited by the Patent:
Cited by examiner (2)

Return to Previous Page