特許
J-GLOBAL ID:200903044421645445

話者照合装置

発明者:
出願人/特許権者:
代理人 (1件): 岩橋 文雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-205925
公開番号(公開出願番号):特開2001-034294
出願日: 1999年07月21日
公開日(公表日): 2001年02月09日
要約:
【要約】【課題】 個人性の出やすい音素と出にくい音素とを区別することにより、照合性能の向上を図ることができる話者照合装置を提供することを目的とする。【解決手段】 標準話者の発声の特徴データを抽出する第1の特徴抽出部102と、多数話者の発声の特徴データを抽出する第2の特徴抽出部105と、標準話者・多数話者の特徴データの対応をとるマッチング部107と、標準話者の各分析フレームの特徴データに対応する多数話者の複数の特徴データから共分散行列を計算し、話者間の共分散行列を求める特徴データ統計分析部110と、第3の特徴抽出部113からの登録話者特徴データの時系列データそれぞれに最も近い標準話者特徴データの平均値と標準話者特徴データの平均値に対応する分析フレーム番号の全話者の特徴データの話者間のばらつきを考慮した多数話者特徴データ共分散行列とを登録する平均・分散対応付け部115とを有する。
請求項(抜粋):
標準話者の発声の特徴データを抽出する第1の特徴抽出部と、標準話者の発声と同じ内容の多数話者の発声の特徴データを抽出する第2の特徴抽出部と、前記第1の特徴抽出部からの標準話者特徴データと前記第2の特徴抽出部からの多数話者特徴データとの対応をとるマッチング部と、標準話者の各分析フレームの特徴データに対応する多数話者の複数の特徴データから共分散行列を計算し、全多数話者の共分散行列と話者内の共分散行列とから話者間の共分散行列を求める特徴データ統計分析部と、登録話者の発声の特徴データを抽出する第3の特徴抽出部と、前記第3の特徴抽出部からの登録話者特徴データの時系列データそれぞれに最も近い標準話者特徴データの平均値と前記標準話者特徴データの平均値に対応する分析フレーム番号の全話者の特徴データの話者間のばらつきを考慮した多数話者特徴データ共分散行列とを組にして登録済みデータとして登録する平均・分散対応付け部と、照合話者の音声の特徴データを抽出する第4の特徴抽出部と、前記第4の特徴抽出部からの照合話者特徴データと前記平均・分散対応付け部からの登録済みデータの平均、分散とを用いて分散によるばらつきを考慮した距離計算を行う統計的距離計算部と、認証の厳しさ等に基づく閾値を設定し、前記統計的距離計算部で得られた距離に基づいて本人か否かの判定を行う判定部とを有することを特徴とする話者照合装置。
IPC (4件):
G10L 17/00 ,  G10L 15/06 ,  G10L 15/10 ,  G10L 15/28
FI (5件):
G10L 3/00 545 A ,  G10L 3/00 521 P ,  G10L 3/00 521 E ,  G10L 3/00 531 F ,  G10L 3/00 561 B
Fターム (5件):
5D015AA03 ,  5D015FF05 ,  5D015GG05 ,  5D015HH05 ,  5D015HH21

前のページに戻る