Pat
J-GLOBAL ID:200903009576412757
音声セグメンテーション方法
Inventor:
,
,
,
Applicant, Patent owner:
Agent (1):
足立 勉
Gazette classification:公開公報
Application number (International application number):1993126111
Publication number (International publication number):1994337692
Application date: May. 27, 1993
Publication date: Dec. 06, 1994
Summary:
【要約】【目的】 少ない計算量で、特に子音区間を正確に認識することを可能とする音声セグメンテーション方法を提供する。【構成】 図2は本発明の一実施例における音声セグメンテーション方法の構成を示すブロック図である。音響分析部10は、入力音声をフィルタに通してA/D変換し、特徴パラメータ抽出部12は、所定のフレーム周期毎に分析してフレーム毎の特徴パラメータ(本実施例ではLPCケプストラム係数)を求めて特徴パラメータ時系列を生成する。大分類音素識別部14(実施例ではニューラルネット)は、特徴パラメータ時系列をフレーム単位でずらしながら所定数フレーム毎の音響的特徴から大分類音素を識別して大分類音素列を生成する。子音細分類音素認識部16は、大分類音素列に予め用意された大分類音素組み合せ表16a(表2)を対応させてセグメンテーションおよび子音細分類認識結果を得る。
Claim (excerpt):
入力音声を所定のフレーム周期毎に分析してフレーム毎の特徴パラメータを求めて特徴パラメータ時系列を生成し、該特徴パラメータ時系列をフレーム単位でずらしながら所定数フレーム毎の音響的特徴から大分類音素を識別して大分類音素列を生成し、該大分類音素列の内、同じ大分類音素が予め定められた数以上連続する区間を1つの大分類音素区間として大分類音素区間列を生成し、該大分類音素区間列の連続する大分類音素区間を予め定められた大分類音素の組み合せに対応させて音素を決定することを特徴とする音声セグメンテーション方法。
IPC (3):
G10L 3/00 515
, G10L 5/06
, G10L 9/10 301
Return to Previous Page