Pat
J-GLOBAL ID:200903018156821375
音素認識装置および音素認識方法
Inventor:
,
,
Applicant, Patent owner:
Agent (1):
藤谷 修
Gazette classification:公開公報
Application number (International application number):1993164284
Publication number (International publication number):1994348299
Application date: Jun. 07, 1993
Publication date: Dec. 22, 1994
Summary:
【要約】【目的】入力音が極めて効率よく計算、分析され、精度よく音素認識されること。【構成】図1は本発明の音素認識装置を示す構成図で、入力音の分析手段2、セグメンテーション(SG)・大分類ニューラルネットワーク(NN) 3、SG・大分類認識手段4、細分類選択・駆動手段5、細分類NN 6、細分類認識手段7、認識音素8とから成る。入力音の音素を認識するため、まず大分類NNのみを駆動してSGと大分類認識を同時に行い、大分類されたSG区間について細分類認識のために必要な細分類NNのみを選択・駆動して最終的な細かい音素認識を行う構成とする。
Claim (excerpt):
ニューラルネットワークを用いた音素認識装置において、入力音を所定のフレーム周期ごとに分析して複数個の特徴パラメータを求める分析手段と、前記特徴パラメータを時間的にフレーム単位でずらしながら、所定フレーム数分とった特徴パラメータ系列が入力されて、該入力音をセグメンテーションすると同時に、音素の大分類認識を行うのに必要な出力値を得るセグメンテーション・大分類ニューラルネットワークと、同じく前記特徴パラメータ系列が入力されて音素の細分類認識を行うのに必要な出力値を得る複数個の細分類ニューラルネットワークより成る細分類ニューラルネットワーク群と、前記セグメンテーション・大分類ニューラルネットワークの出力値をもとに該入力音をセグメンテーションすると同時に、音素の大分類を行うセグメンテーション・大分類認識手段と、このセグメンテーション・大分類結果に基づいて、該当する細分類ニューラルネットワーク群より逐次選択すると同時に、セグメンテーションされた区間について駆動する細分類ニューラルネットワーク選択・駆動手段と、前記細分類ニューラルネットワーク群の出力値をもとに該入力音に対応した認識音素列を得る細分類認識手段とから構成されることを特徴とする音素認識装置。
IPC (4):
G10L 9/10 301
, G06F 15/18
, G10L 3/00 515
, G10L 5/06
Return to Previous Page