特許
J-GLOBAL ID:200903056266782439

音声照合装置、音声照合方法、及び音声照合処理プログラムを記憶した記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦 (外5名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-208910
公開番号(公開出願番号):特開2002-023792
出願日: 2000年07月10日
公開日(公表日): 2002年01月25日
要約:
【要約】【課題】本人照合を音声により行う音声照合装置で、短時間の音声信号データに対しても、照合率の高い話者照合を行うこと。【解決手段】登録音声スペクトログラムに配置した複数の2次元テンプレートと最大相関係数が算出される照合音声スペクトログラム上の各領域が検出される。また、登録音声スペクトログラム及び照合音声スペクトログラムからそれぞれの加算周波数スペクトル分布SumA及びSumBが導出され、SumA上に配置した複数の1次元テンプレートと最大相関係数が算出されるSumB上の各領域が検出される。すると前記2次元テンプレートの相互位置関係とその最大相関検出領域の相互位置関係との相違が比較評価されると共に、前記1次元テンプレートの相互位置関係とその最大相関検出領域の相互位置関係との相違が比較評価され、その総合的な相違度により登録音声と照合音声との同一性が判定される。
請求項(抜粋):
登録話者の音声と照合話者の音声とを照合する音声照合装置であって、音声信号を入力する音声信号入力手段と、この音声信号入力手段により入力された音声信号をその音声特徴を表す2次元データに変換するデータ変換手段と、このデータ変換手段により変換された登録話者の音声信号に対応する2次元データを記憶する登録話者情報記憶手段と、この登録話者情報記憶手段に記憶された登録音声の2次元データに対して複数の領域を定義する2次元テンプレートを配置する2次元テンプレート配置手段と、前記データ変換手段により変換された照合話者の音声信号に対応する2次元データ上で、前記2次元テンプレート配置手段により登録音声の2次元データに配置された複数の2次元テンプレートのそれぞれに対応する領域と最大の相関係数が算出される複数の領域を検出する2次元相関領域検出手段と、前記2次元テンプレート配置手段により登録音声の2次元データに配置された複数の2次元テンプレートの相互位置関係と前記2次元相関領域検出手段により前記照合音声の2次元データ上で検出された複数の領域の相互位置関係とを比較評価する第1の評価手段と、前記登録話者情報記憶手段に記憶された登録音声の2次元データ及び前記データ変換手段により変換された照合話者の音声信号に対応する2次元データからそれぞれその特徴を表す1次元データを導出する1次元データ導出手段と、この1次元データ導出手段により導出された登録音声に対応する1次元データに対して複数の領域を定義する1次元テンプレートを配置する1次元テンプレート配置手段と、前記1次元データ導出手段により導出された照合話者の音声信号に対応する1次元データ上で、前記1次元テンプレート配置手段により登録音声に対応する1次元データに配置された複数の1次元テンプレートのそれぞれに対応する領域と最大の相関係数が算出される複数の領域を検出する1次元相関領域検出手段と、前記1次元テンプレート配置手段により登録音声に対応する1次元データに配置された複数の1次元テンプレートの相互位置関係と前記1次元相関領域検出手段により前記照合音声に対応する1次元データ上で検出された複数の領域の相互位置関係とを比較評価する第2の評価手段と、前記第1の評価手段による2次元データ上での評価結果と前記第2の評価手段による1次元データ上での評価結果とに基づき前記登録話者の音声信号と照合話者の音声信号との同一性を判定する照合判定手段と、を備えたことを特徴とする音声照合装置。
IPC (2件):
G10L 17/00 ,  G10L 15/08
FI (3件):
G10L 3/00 545 A ,  G10L 3/00 541 ,  G10L 7/08 C
Fターム (2件):
5D015AA03 ,  5D015HH11

前のページに戻る