Pat
J-GLOBAL ID:200903010675853771

話者認識方法

Inventor:
Applicant, Patent owner:
Agent (1): 草野 卓
Gazette classification:公開公報
Application number (International application number):1992344586
Publication number (International publication number):1993323990
Application date: Dec. 24, 1992
Publication date: Dec. 07, 1993
Summary:
【要約】【目的】 発声内容依存型の方法で他人の音声を録音したものを再生して他人になりすますことを防止できる。【構成】 登録すべき各話者について、学習用音声データと、その発声内容を表す仮名あるいは発音記号の系列とを教師つき話者適応部1に入力し、これらを用いて、不特定話者用音素/音節モデル蓄積部3からの音素/音節モデルを、その登録すべき話者に適応化する。その適応化された音素/音節モデルをその発声者のIDとともに蓄積部3に蓄積する。話者認識をする場合は、認識用文章/単語生成部4から認識ごとに新しい文章/単語を生成して示し、その文章/単語を発声させ、その音声を特徴パラメータ抽出部5で特徴パラメータ系列に変換する。音声モデル生成部6で生成部4から生成した文章/単語に従って蓄積部3の適応化された音素/音節モデルを接続し、これと入力音声の特徴パラメータ系列との類似度を計算部7で計算して、その結果で話者認識を行う。更に、この類似度のばらつきを正規化30することも行う。
Claim (excerpt):
認識すべき各話者の声に適応した音素あるいは音節モデルを作成して登録する手段と、それら音素あるいは音節モデルを接続して文章または単語音声のモデルを生成する手段と、入力音声を特徴パラメータを用いた表現形式に変換する手段とを有し、上記表現形式に変換された入力音声と、あらかじめ話者対応に登録された音素あるいは音節モデルを接続した文章または単語音声モデルとの類似度を求めて、上記入力音声を発声した話者を認識することを特徴とする話者認識方法。
IPC (3):
G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 571
Patent cited by the Patent:
Cited by examiner (3)
  • 特開昭61-278898
  • 特開昭60-019884
  • 特開平3-274597

Return to Previous Page