特許
J-GLOBAL ID:200903040640981269

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-014399
公開番号(公開出願番号):特開平5-210396
出願日: 1992年01月30日
公開日(公表日): 1993年08月20日
要約:
【要約】【目的】 話者や環境の違いによらず類似度を同一の尺度で比較できるように、類似度を補正する方法を、ワードスポッティングに適用し、安定した音声の検出を可能にする。【構成】 ベクトル間類似度計算部2で、入力音声Iの特徴ベクトルVとあらかじめ登録しておいた標準パターンとのベクトル間類似度Dをフレームごとに求める。次に、類似度補正部3で、ベクトル間類似度Dの補正を同じフレームにおけるDの最大値を用いて行ない、フレーム補正類似度Fを求める。類似度累積部4においては、フレーム補正類似度Fを累積し、補正類似度Cを求める。識別部5において、補正類似度Cの最大値を与える標準パターンを認識結果Aとして求める。
請求項(抜粋):
入力された音声信号を特徴ベクトルのフレームの時系列に変換する分析部と、あらかじめ登録された標準パターンを構成する特徴ベクトルと前記入力された音声信号の特徴ベクトルとのベクトル間類似度を入力された音声信号の各フレームごとに求めるベクトル間類似度計算部と、入力された音声信号の各フレームにおける前記ベクトル間類似度の最大値を用いて補正したフレーム補正類似度を求める類似度補正部と、前記フレーム補正類似度を累積し補正類似度とする類似度累積部と、前記補正類似度をもとに音声を識別する識別部を有する音声認識装置。
IPC (3件):
G10L 3/00 531 ,  G10L 3/00 513 ,  G10L 3/00 561

前のページに戻る