特許
J-GLOBAL ID:200903043630984471

音声認識方法および音声認識処理プログラムを記録した記録媒体ならびに音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 上柳 雅誉 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-322914
公開番号(公開出願番号):特開2002-132289
出願日: 2000年10月23日
公開日(公表日): 2002年05月09日
要約:
【要約】【課題】複数種の雑音の存在する環境下であっても高い認識率を得るようにする。【解決手段】種類の異なる雑音が重畳されたそれぞれの音声データに対し、スペクトラル・サブトラクションの雑音除去手法(SS法という)を用いて雑音除去を行い、雑音除去後のそれぞれの音声データを特徴分析して得られた特徴ベクトルにより作成された雑音の種類対応の音響モデルを用意する。認識時には、認識対象音声データに対し、第1の音声特徴分析を行い、雑音区間/音声区間を判定し、雑音区間の場合にはその特徴データを保存し(ステップs1〜s3)、音声区間の場合には保存された特徴データによって雑音種類を判定し、その結果によって、対応する音響モデルを選択する(ステップs5)。そして、認識対象音声データに対し、SS法による雑音除去を行い、その雑音除去後の音声データに対し、音声認識用の特徴ベクトルを得るための第2の音声特徴分析を行う(ステップs6,s7)。
請求項(抜粋):
種類の異なる雑音が雑音の種類ごとに重畳されたそれぞれの音声データを作成し、これら雑音が重畳されたそれぞれの音声データに対し、所定の雑音除去手法を用いて雑音除去を行い、その雑音除去されたそれぞれの音声データの特徴ベクトルを用いることで、雑音の種類に対応する音響モデル群を作成してそれを保持しておき、認識時には、雑音が重畳された認識対象音声データに対し、重畳されている雑音の種類を判定し、その判定結果に基づいて、前記雑音の種類に対応した音響モデル群の中から所定の音響モデルを選択するとともに、前記雑音が重畳された認識対象音声データに対し、前記所定の雑音除去方法を用いて雑音除去を行い、その雑音除去された音声データの特徴ベクトルに対し前記選択された音響モデルを用いて音声認識を行うことを特徴とする音声認識方法。
IPC (3件):
G10L 15/20 ,  G10L 15/06 ,  G10L 21/02
FI (3件):
G10L 3/00 531 Q ,  G10L 3/00 521 T ,  G10L 3/02 301 D
Fターム (3件):
5D015AA05 ,  5D015CC11 ,  5D015EE05
引用特許:
審査官引用 (8件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平3-329063   出願人:株式会社日立製作所
  • 音声認識方法及び装置
    公報種別:公開公報   出願番号:特願平8-068046   出願人:キヤノン株式会社
  • 特開昭62-042198
全件表示

前のページに戻る