特許
J-GLOBAL ID:200903010675853771

話者認識方法

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平4-344586
公開番号(公開出願番号):特開平5-323990
出願日: 1992年12月24日
公開日(公表日): 1993年12月07日
要約:
【要約】【目的】 発声内容依存型の方法で他人の音声を録音したものを再生して他人になりすますことを防止できる。【構成】 登録すべき各話者について、学習用音声データと、その発声内容を表す仮名あるいは発音記号の系列とを教師つき話者適応部1に入力し、これらを用いて、不特定話者用音素/音節モデル蓄積部3からの音素/音節モデルを、その登録すべき話者に適応化する。その適応化された音素/音節モデルをその発声者のIDとともに蓄積部3に蓄積する。話者認識をする場合は、認識用文章/単語生成部4から認識ごとに新しい文章/単語を生成して示し、その文章/単語を発声させ、その音声を特徴パラメータ抽出部5で特徴パラメータ系列に変換する。音声モデル生成部6で生成部4から生成した文章/単語に従って蓄積部3の適応化された音素/音節モデルを接続し、これと入力音声の特徴パラメータ系列との類似度を計算部7で計算して、その結果で話者認識を行う。更に、この類似度のばらつきを正規化30することも行う。
請求項(抜粋):
認識すべき各話者の声に適応した音素あるいは音節モデルを作成して登録する手段と、それら音素あるいは音節モデルを接続して文章または単語音声のモデルを生成する手段と、入力音声を特徴パラメータを用いた表現形式に変換する手段とを有し、上記表現形式に変換された入力音声と、あらかじめ話者対応に登録された音素あるいは音節モデルを接続した文章または単語音声モデルとの類似度を求めて、上記入力音声を発声した話者を認識することを特徴とする話者認識方法。
IPC (3件):
G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 571
引用特許:
審査官引用 (3件)
  • 特開昭61-278898
  • 特開昭60-019884
  • 特開平3-274597

前のページに戻る