特許
J-GLOBAL ID:200903079517633519

不特定話者用連続音声認識方法及び不特定話者用連続音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 豊田 善雄 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-279917
公開番号(公開出願番号):特開平9-101797
出願日: 1995年10月04日
公開日(公表日): 1997年04月15日
要約:
【要約】【課題】 不特定の話者が発した文章や日常会話等の連続音声の認識を、容易に且つ高い認識率で行うことができる音声認識方法を提供する。【解決手段】 連続音声信号レベルの極小値が減少傾向から増加傾向に変移する点を時系列的に求め、該変移点より音声ピッチを検出する操作1と、連続音声信号レベルの最大信号レベルを求め、これと各極大値との信号比及び前記音声ピッチに基づいて母音領域と子音領域を分別する操作2と、各母音領域及び各子音領域において抽出された音声信号波形の特徴と、予め抽出しておいた各母音及び各子音の基本波形の特徴とを照合して、母音或は子音を特定する操作3とを、音声認識過程において実行する。
請求項(抜粋):
(1)連続音声信号レベルの極小値が減少傾向から増加傾向に変移する点、或は極大値が増加傾向から減少傾向に変移する点を時系列的に求め、相隣接する該変移点より音声ピッチを検出する操作1と、(2)前記連続音声信号レベルの極大値を順次比較して最大信号レベルを求め、該最大信号レベルと各極大値との信号比を算出し、該信号比と前記操作1によって検出された前記音声ピッチに基づいて母音領域と子音領域を分別する操作2と、(3)前記操作2によって分別された母音領域において、前記操作1によって検出された各音声ピッチの境界を起点として、音声信号波形の特徴を抽出し、この抽出された特徴と、予め抽出しておいた各母音の基本波形の特徴とを照合することにより母音を特定し、前記操作2によって分別された子音領域において、音声信号波形の特徴を抽出し、この抽出された特徴と、予め抽出しておいた各子音の基本波形の特徴とを照合することにより子音を特定する操作3とを、音声認識過程に含むことを特徴とする不特定話者用連続音声認識方法。
IPC (3件):
G10L 3/00 515 ,  G10L 9/00 301 ,  G10L 9/18 301
FI (3件):
G10L 3/00 515 C ,  G10L 9/00 301 A ,  G10L 9/18 301 B

前のページに戻る