特許
J-GLOBAL ID:200903085395082176
音韻セグメンテーション及び分類方法
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
鈴木 敏明
公報種別:公開公報
出願番号(国際出願番号):特願平4-104603
公開番号(公開出願番号):特開平5-297888
出願日: 1992年04月23日
公開日(公表日): 1993年11月12日
要約:
【要約】【目的】 大局的に拡張性に優れたシステムとなりかつ話者適応が容易なセグメンテーション方法及び音韻分類方法にする。【構成】 音声分析部21、22で抽出した音声特徴ベクトルを、射影ベクトル演算部3と射影演算子メモリ4とによって、次元縮小された射影ベクトルへ変換し、この射影ベクトルの時系列に基づいて、セグメンテーションあるいは音韻分類を行う。メモリ4で蓄積された射影演算子は音韻学習サンプルの主成分分析によって作成したものであり、射影ベクトルは、低次元で音声特徴の大部分を荷担し、音源特徴と声道特徴を荷担する重要な要素であるという性質で疑似的に固定された特徴となる。そのためシステムが拡張性に富むものとなり、射影演算子の変更などにより容易に話者適応が可能となる。
請求項(抜粋):
1個以上の音源特徴要素と2個以上の声道特徴とを要素として含む音声特徴ベクトルからなる学習音韻サンプルに対して主成分分析を行い、一定次元まで次元縮小して得られた主成分の係数を、射影演算子として記憶しておき、入力音声信号を分析して、1個以上の音源特徴と2個以上の声道特徴とを要素として含む音声特徴ベクトルを抽出するを段階と、前記射影演算子を加重として用い、前記入力音声信号の前記音声特徴ベクトルの要素を加算することにより、前記音声特徴ベクトルを前記縮小次元の射影ベクトルへ変換する段階と、その射影ベクトルの時系列を音韻セグメントにセグメンテーションする段階と、各音韻セグメント毎に、複数の前記射影ベクトルを選択する段階とを備え、選択したその音韻ベクトルに基づいて各音韻を大分類することを特徴とした音韻分類方法。
IPC (3件):
G10L 3/00 531
, G10L 3/00 515
, G10L 3/00 521
前のページに戻る