特許
J-GLOBAL ID:200903097767874501

話者照合方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 上村 輝之
公報種別:公開公報
出願番号(国際出願番号):特願平10-339213
公開番号(公開出願番号):特開2000-163092
出願日: 1998年11月30日
公開日(公表日): 2000年06月16日
要約:
【要約】【課題】 話者照合の性能を向上させるようにする。【解決手段】 個人用辞書作成部13は音声登録時に読込んだ音声に基づき新規ユーザの音素辞書を作成し、個人辞書格納部23に格納する。これは話者を単位としたコホート話者セットの設定である。音素別近傍話者選択部17は音声登録時に新規の音素辞書の各音素別に各音素と音響空間上の距離が近い話者情報を格納部23に格納済みの登録話者の音素辞書中から音素別に選出する。話者情報を距離の近いものから順に整理して音素別近傍話者テーブル格納部21に格納する。これは音素を単位としたコホート話者セットの設定である。個人認証部15は認証時に読込んだ音声に対する本人話者の音素辞書の尤度を計算する。背景話者用辞書合成部19は格納部21内の情報を基に本人話者の音素辞書の夫々の音素に対し各音素の近傍話者の音素を組合わせることにより背景話者の音素辞書を合成する。入力音声に対する背景話者の尤度の平均値を計算する。正規化尤度を算出し事前に設定された閾値との大小関係を比較し受理/棄却の判定を行う。
請求項(抜粋):
本人話者に対して背景話者を設定し、入力音声に対する本人話者の照合スコアを、その入力音声に対する背景話者の照合スコアで正規化する話者照合装置において、各話者の音響モデルの中から、局所的な特徴に関して登録話者の音響モデルとの音響空間上における距離が比較的近い話者を選択する手段と、前記選択された話者を、前記登録話者の近傍話者として保持する手段と、前記近傍話者の音響モデルの局所的な特徴を、本人話者の音響モデルの各々の局所的な特徴に対応させて組合わせることにより背景話者の音響モデルを合成する手段と、を備えることを特徴とする話者照合装置。
IPC (3件):
G10L 17/00 ,  G10L 15/14 ,  G10L 15/28
FI (4件):
G10L 3/00 521 P ,  G10L 3/00 535 A ,  G10L 3/00 545 C ,  G10L 3/00 561 A
Fターム (5件):
5D015AA03 ,  5D015GG01 ,  5D015GG05 ,  5D015HH04 ,  5D015LL03
引用特許:
審査官引用 (5件)
全件表示

前のページに戻る