Pat
J-GLOBAL ID:200903067015885044
不特定話者音素認識方法
Inventor:
Applicant, Patent owner:
Agent (1):
志賀 富士弥 (外1名)
Gazette classification:公開公報
Application number (International application number):1992013516
Publication number (International publication number):1993204399
Application date: Jan. 29, 1992
Publication date: Aug. 13, 1993
Summary:
【要約】【目的】 少数話者の発声する音声データで学習させても良好な音素認識結果が得られるようにしたものである。【構成】 階層型ニューラルネットワークで構築した次元圧縮器を用いて音声データを圧縮する。圧縮されたデータと学習ベクトル量子化(LVQ)によって参照ベクトルを得る。得られた参照ベクトルとの写像関数を別の階層型ニューラルネットで学習させる。これにより学習データと認識データの変動を吸収する。
Claim (excerpt):
階層型ニューラルネットワークで構築した次元圧縮器で音声データを圧縮し、その圧縮されたデータと学習ベクトル量子化法によって得られる参照ベクトルとの写像関数をもう1つの階層型ニューラルネットワークで学習させて学習データと認識データの変動を吸収し、少数話者の音声データで学習ベクトル量子化法に不特定性を持たせるようにしたことを特徴とする不特定話者音素認識方法。
IPC (3):
G10L 9/10 301
, G06F 15/18
, G10L 3/00 531
Return to Previous Page