Pat
J-GLOBAL ID:200903006679431530
話者適応音声認識装置
Inventor:
,
Applicant, Patent owner:
Agent (1):
森田 寛 (外1名)
Gazette classification:公開公報
Application number (International application number):1991198179
Publication number (International publication number):1993040497
Application date: Aug. 08, 1991
Publication date: Feb. 19, 1993
Summary:
【要約】【目的】本発明は、新規話者の音声を認識する話者適応音声認識装置に関し、高い認識率を実現できるようにすることを目的とする。【構成】音声特徴量と音声内容との対応関係を管理する複数のテンプレート20と、パラメータに従ってテンプレート20の管理する音声特徴量を変換する変換部21と、変換部21の変換するテンプレート20の音声特徴量が学習用音声入力の音声特徴量と一致するようになるパラメータを学習して変換部21に設定する学習部23と、選択用音声入力の音声特徴量と変換部21の変換する音声特徴量とを比較することで、選択用音声入力の音声特徴量に近いものを示すテンプレート20を選択する選択部25とを備え、選択部25の選択するテンプレート20の音声特徴量を変換部21により変換して新規話者用の話者テンプレートを生成していくことで、新規話者音声の音声内容を認識していくように構成する。
Claim (excerpt):
新規話者の音声を認識する話者適応音声認識装置において、音声特徴量と音声内容との対応関係を管理する話者テンプレート(20)を複数用意するとともに、設定されるパラメータに従って、上記話者テンプレート(20)の管理する音声特徴量を変換する変換部(21)と、学習用音声入力が与えられるときに、上記変換部(21)により変換される上記話者テンプレート(20)の音声特徴量が、対応する該学習用音声入力の持つ音声特徴量と概略一致するようになる上記パラメータを学習して上記変換部(21)に設定する学習部(23)と、選択用音声入力が与えられるときに、該選択用音声入力の持つ音声特徴量と上記変換部(21)の変換する対応の音声特徴量とを比較することで、上記変換部(21)により変換される音声特徴量が該選択用音声入力の持つ音声特徴量に近いものを示す1つ又は複数の上記話者テンプレート(20)を選択する選択部(25)とを備え、上記選択部(25)により選択される上記話者テンプレート(20)の音声特徴量を上記変換部(21)により変換していくことで、新規話者用の話者テンプレートを生成して、この生成される話者テンプレートを用いて新規話者の音声入力の持つ音声内容を認識していくよう処理することを、特徴とする話者適応音声認識装置。
IPC (3):
G10L 3/00 531
, G06F 15/38
, G10L 3/02 301
Patent cited by the Patent:
Return to Previous Page