特許
J-GLOBAL ID:200903004943598666

話者認識方式

発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願平3-282843
公開番号(公開出願番号):特開平5-119799
出願日: 1991年10月29日
公開日(公表日): 1993年05月18日
要約:
【要約】【目的】 発声内容を限定しない入力音声に基づく話者認識方式において、比較的短い発声で高い認識率を得るとともに、学習を軽減すること。【構成】 ニューラルネットワーク13を用いて話者認識を行なうに際し、入力音声から抽出した短時間スペクトルの概形を表わすベクトルの系列をニューラルネットワーク13への入力とし、当該入力に対するニューラルネットワーク13からの出力ベクトルの系列を、総合的に判断することにより話者認識を行なう話者認識方式であって、入力音声を分析区間毎に有声/無声判定し有声区間のみをニューラルネットワーク13への入力の対象区間にするようにしたものである。
請求項(抜粋):
ニューラルネットワークを用いて話者認識を行なうに際し、入力音声から抽出した短時間スペクトルの概形を表わすベクトルの系列をニューラルネットワークへの入力とし、当該入力に対するニューラルネットワークからの出力ベクトルの系列を、総合的に判断することにより話者認識を行なう話者認識方式であって、入力音声を分析区間毎に有声/無声判定し有声区間のみをニューラルネットワークへの入力の対象区間にすることを特徴とする話者認識方式。
IPC (5件):
G10L 9/10 301 ,  G06F 3/16 320 ,  G06F 15/18 ,  G10L 3/00 515 ,  G10L 3/00 531

前のページに戻る