特許
J-GLOBAL ID:200903034056696854
セグメンテーション及び音素の大分類認識法
発明者:
,
,
出願人/特許権者:
代理人 (1件):
碓氷 裕彦
公報種別:公開公報
出願番号(国際出願番号):特願平4-284361
公開番号(公開出願番号):特開平6-130993
出願日: 1992年10月22日
公開日(公表日): 1994年05月13日
要約:
【要約】【目的】 入力音声を正確なフレーム位置で精度良くセグメンテーションして大分類すること。【構成】 入力音声に対してLPC分析1を行って線形予測係数と残差パワーとを求め、これによりケプストラム係数を算出し、さらに、このケプストラム係数に基づいて特徴パラメータPnf系列2をフレームf毎に求める。続いて、このフレームfの所定フレーム数分Pnf-m(またはPnf)をニューラルネットワーク3に入力する。そして、ニューラルネットワーク3の出力値時系列4に対して出力選択5はフレーム毎に各出力値を所定のしきい値と比較し、そのしきい値を越えたものあるいは最大出力となったものを選択して、その出力値に対応する段分類音素記号に置き換えることにより、フレーム毎の大分類音素列を得る。そして、この大分類音素列に対してスムージング・整形処理6を行って、セグメンテーション・大分類認識結果を得る。
請求項(抜粋):
入力音声を所定のフレーム周期毎に分析して複数個の特徴パラメータを求め、前記特徴パラメータを時間的にフレーム単位でずらしながら所定フレーム数分とった特徴パラメータ系列をニューラルネットワークに入力させて、音素の大分類数に相当する数の出力値をフレーム周期毎に出力させ、前記ニューラルネットワークの出力値の時系列に基づいて前記入力音声をセグメンテーションするとともに音素の大分類認識を行うことを特徴とするセグメンテーション及び音素の大分類認識法。
IPC (3件):
G10L 9/10 301
, G06F 15/18
, G10L 9/14 301
引用特許:
審査官引用 (4件)
-
特開平2-254498
-
特開平4-066999
-
特開平2-253300
前のページに戻る