特許
J-GLOBAL ID:200903041970863986

認識装置および認識方法、並びに学習装置および学習方法

発明者:
出願人/特許権者:
代理人 (1件): 稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願平8-347312
公開番号(公開出願番号):特開平10-187186
出願日: 1996年12月26日
公開日(公表日): 1998年07月14日
要約:
【要約】【課題】 音声の認識率を、より向上させる。【解決手段】 入力部10からは、ユーザが発した音声データ、ユーザの口を撮影した画像データ、周囲の雑音のデータなどの複数種類のデータが出力される。これらのデータは、前処理部20乃至23においてそれぞれ分析され、これにより特徴パラメータが求められる。クラス分類用データ構成部24では、これらの特徴パラメータからクラス分類用データが構成され、クラス分類部25でクラス分類される。一方、統合パラメータ構成部26では、前処理部20乃至23が出力する特徴パラメータから統合パラメータが構成される。そして、適応判定部27では、クラス分類部25のクラス分類結果に対応したテーブルが選択され、そのテーブルに登録されている標準パラメータと、統合パラメータ構成部26が出力する統合パラメータとに基づいて、ユーザが発した音声が認識される。
請求項(抜粋):
所定の認識対象を、複数種類の入力データから認識する認識装置であって、前記複数種類の入力データを、その性質に応じて、所定のクラスに分類するクラス分類を行う第1のクラス分類手段と、前記複数種類の入力データを統合した統合パラメータを構成する統合パラメータ構成手段と、前記第1のクラス分類手段が出力するクラスごとに、所定の標準のパラメータが登録されているテーブルを記憶している標準パラメータ記憶手段と、前記第1のクラス分類手段が出力するクラスに対応するテーブルに登録された標準のパラメータと、前記統合パラメータとに基づいて、前記認識対象を認識する認識手段とを備えることを特徴とする認識装置。
IPC (3件):
G10L 3/00 571 ,  G10L 3/00 521 ,  G06F 15/18 560
FI (3件):
G10L 3/00 571 G ,  G10L 3/00 521 C ,  G06F 15/18 560 A
引用特許:
出願人引用 (7件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平7-289865   出願人:日本電信電話株式会社
  • 特開平2-262199
  • 特開平3-129400
全件表示
審査官引用 (4件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平7-289865   出願人:日本電信電話株式会社
  • 特開平2-262199
  • 特開平3-129400
全件表示

前のページに戻る