特許
J-GLOBAL ID:200903033644903592
音声認証装置、音声認証方法、及び音声認証処理プログラムを記憶した記憶媒体
発明者:
出願人/特許権者:
代理人 (1件):
鈴江 武彦 (外5名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-301502
公開番号(公開出願番号):特開2002-108392
出願日: 2000年09月29日
公開日(公表日): 2002年04月10日
要約:
【要約】【課題】本人照合を音声データにより行う音声認証装置で、登録音声と照合音声との発声速度にばらつきがある場合でも、照合率の高い話者照合を行うこと。【解決手段】登録話者と照合話者によりそれぞれその登録時と照合時において発声入力される音声信号データを、何れも一定時間間隔毎のフレーム(Frame)に区切ってそのエネルギ(Energy)を計算し、平均エネルギ値より大きいフレームのみを音声部分として取り出してFFTにより周波数スペクトルを時系列に並べたサウンドスペクトログラムの2次元画像に変換する。そして登録音声画像上に配置したテンプレートti内の画像について照合音声画像上での最大相関係数が得られる画像位置Tiを検出し、各画像位置の相違Δiから登録音声と照合音声との同一性を判定するので、登録時と照合時とでその音声発声速度が異なっても、音声部分のみを取り出した登録画像と照合画像間で確実な話者照合が行える。
請求項(抜粋):
登録話者の音声と照合話者の音声とを照合して認証する音声認証装置であって、音声信号を入力する音声信号入力手段と、この音声信号入力手段により入力された音声信号の音声部分を取り出す音声部分取り出し手段と、この音声部分取り出し手段により取り出された音声信号の音声部分を2次元画像に変換するデータ変換手段と、このデータ変換手段により変換された登録話者の音声部分に対応する2次元画像を記憶する登録話者情報記憶手段と、この登録話者情報記憶手段に記憶された登録音声の2次元画像に対し前記データ変換手段により変換された照合話者の音声部分に対応する2次元画像を比較して、前記登録話者の音声信号と照合話者の音声信号との同一性を判定する照合判定手段と、を備えたことを特徴とする音声認証装置。
IPC (5件):
G10L 17/00
, G10L 11/02
, G10L 15/04
, G10L 15/10
, G10L101:027
FI (4件):
G10L101:027
, G10L 3/00 545 A
, G10L 3/00 513 A
, G10L 7/08 B
Fターム (4件):
5D015AA03
, 5D015CC03
, 5D015DD03
, 5D015HH04
前のページに戻る