特許
J-GLOBAL ID:200903009576412757
音声セグメンテーション方法
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
足立 勉
公報種別:公開公報
出願番号(国際出願番号):特願平5-126111
公開番号(公開出願番号):特開平6-337692
出願日: 1993年05月27日
公開日(公表日): 1994年12月06日
要約:
【要約】【目的】 少ない計算量で、特に子音区間を正確に認識することを可能とする音声セグメンテーション方法を提供する。【構成】 図2は本発明の一実施例における音声セグメンテーション方法の構成を示すブロック図である。音響分析部10は、入力音声をフィルタに通してA/D変換し、特徴パラメータ抽出部12は、所定のフレーム周期毎に分析してフレーム毎の特徴パラメータ(本実施例ではLPCケプストラム係数)を求めて特徴パラメータ時系列を生成する。大分類音素識別部14(実施例ではニューラルネット)は、特徴パラメータ時系列をフレーム単位でずらしながら所定数フレーム毎の音響的特徴から大分類音素を識別して大分類音素列を生成する。子音細分類音素認識部16は、大分類音素列に予め用意された大分類音素組み合せ表16a(表2)を対応させてセグメンテーションおよび子音細分類認識結果を得る。
請求項(抜粋):
入力音声を所定のフレーム周期毎に分析してフレーム毎の特徴パラメータを求めて特徴パラメータ時系列を生成し、該特徴パラメータ時系列をフレーム単位でずらしながら所定数フレーム毎の音響的特徴から大分類音素を識別して大分類音素列を生成し、該大分類音素列の内、同じ大分類音素が予め定められた数以上連続する区間を1つの大分類音素区間として大分類音素区間列を生成し、該大分類音素区間列の連続する大分類音素区間を予め定められた大分類音素の組み合せに対応させて音素を決定することを特徴とする音声セグメンテーション方法。
IPC (3件):
G10L 3/00 515
, G10L 5/06
, G10L 9/10 301
前のページに戻る