特許
J-GLOBAL ID:201103089971123170

音声のセグメンテーション方法

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 敏明
公報種別:特許公報
出願番号(国際出願番号):特願平1-145064
公開番号(公開出願番号):特開平3-011399
特許番号:特許第2598518号
出願日: 1989年06月09日
公開日(公表日): 1991年01月18日
請求項(抜粋):
【請求項1】音声入力を所定のサンプリング周波数でA/D変換して得られた音声の時系列信号x(n)から、次式101及び102に基づいて、音声入力の平均パワーP0(n)及び分析次数m次の予測誤差パワーPm(n)をそれぞれ求める工程と、Pm(n)=Pm-1(n){1-(αm(m))2 式102(但し、Lは平均化する区間長、Pm-1(n)は分析次数m-1次の予測誤差パワー、αm(m)は分析次数m次のm番目の予測係数)音声入力の前記平均パワーP0(n)及び前記予測誤差パワーPm(n)とに基づいて、次式103に基づいて、正規化エントロピーMを求める工程と、M=logPm(n)-logP0(n) 式103前記正規化エントロピーMが極大値、極小値及び極大値と時系列的に変化する区間を、1単位の音節又は音韻区間として検出することにより音声のセグメンテーションを行う工程と、を有することを特徴とする音声のセグメンテーション方法。
IPC (1件):
G10L 3/00 515
FI (1件):
G10L 3/00 515 C

前のページに戻る