特許
J-GLOBAL ID:200903018156821375

音素認識装置および音素認識方法

発明者:
出願人/特許権者:
代理人 (1件): 藤谷 修
公報種別:公開公報
出願番号(国際出願番号):特願平5-164284
公開番号(公開出願番号):特開平6-348299
出願日: 1993年06月07日
公開日(公表日): 1994年12月22日
要約:
【要約】【目的】入力音が極めて効率よく計算、分析され、精度よく音素認識されること。【構成】図1は本発明の音素認識装置を示す構成図で、入力音の分析手段2、セグメンテーション(SG)・大分類ニューラルネットワーク(NN) 3、SG・大分類認識手段4、細分類選択・駆動手段5、細分類NN 6、細分類認識手段7、認識音素8とから成る。入力音の音素を認識するため、まず大分類NNのみを駆動してSGと大分類認識を同時に行い、大分類されたSG区間について細分類認識のために必要な細分類NNのみを選択・駆動して最終的な細かい音素認識を行う構成とする。
請求項(抜粋):
ニューラルネットワークを用いた音素認識装置において、入力音を所定のフレーム周期ごとに分析して複数個の特徴パラメータを求める分析手段と、前記特徴パラメータを時間的にフレーム単位でずらしながら、所定フレーム数分とった特徴パラメータ系列が入力されて、該入力音をセグメンテーションすると同時に、音素の大分類認識を行うのに必要な出力値を得るセグメンテーション・大分類ニューラルネットワークと、同じく前記特徴パラメータ系列が入力されて音素の細分類認識を行うのに必要な出力値を得る複数個の細分類ニューラルネットワークより成る細分類ニューラルネットワーク群と、前記セグメンテーション・大分類ニューラルネットワークの出力値をもとに該入力音をセグメンテーションすると同時に、音素の大分類を行うセグメンテーション・大分類認識手段と、このセグメンテーション・大分類結果に基づいて、該当する細分類ニューラルネットワーク群より逐次選択すると同時に、セグメンテーションされた区間について駆動する細分類ニューラルネットワーク選択・駆動手段と、前記細分類ニューラルネットワーク群の出力値をもとに該入力音に対応した認識音素列を得る細分類認識手段とから構成されることを特徴とする音素認識装置。
IPC (4件):
G10L 9/10 301 ,  G06F 15/18 ,  G10L 3/00 515 ,  G10L 5/06

前のページに戻る