特許
J-GLOBAL ID:200903092734324288

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 千葉 剛宏 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-323027
公開番号(公開出願番号):特開平11-065589
出願日: 1997年11月25日
公開日(公表日): 1999年03月09日
要約:
【要約】【課題】簡単な横成で、不特定話者の発話の多様性に対しても高性能を維持することができて、誤認識を低減させた音声認識装置を提供する。【解決手段】音声信号を周波数分析して得た周波数スペクトルを、時間軸に沿って順次求めて時系列データ群に変換する周波数分析器2に、複数の学習話者からの音声信号が入力されたとき周波数分析器2から出力される時系列データを部分周波数-時間パターン作成器3によって予め定めた時間窓で切り出し、切り出された時系列データ群を主成分分析器4によって主成分分析した主成分に基づき入力時系列データを低次の時系列データに特徴抽出フィルタ5にて圧縮する。複数の学習話者からの音声信号を低次の時系列データに圧縮した参照用低次圧縮時系列データと、不特定話者からの音声信号を圧縮した低次の時系列データとを照合して、照合結果に基づいて不特定話者からの音声を認識する。
請求項(抜粋):
音声信号を周波数分析して得た周波数スペクトルを、時間軸に沿って順次求めて時系列データ群に変換する周波数分析手段と、複数の学習話者から発話された音声に基づく音声信号が入力された前記周波数分析手段からの出力時系列データを予め定めた時間窓で切り出す切り出し手段と、前記切り出し手段によって切り出された時系列データ群を用いて主成分分析を行う主成分分析手段と、前記主成分分析により得た主成分に基づき入力時系列データを低次の時系列データに圧縮する特徴抽出フィルタ手段とを備え、前記複数の学習話者から発話された音声に基づく低次の時系列データを参照用低次時系列データとし、該参照用低次時系列データと不特定話者から発話された音声に基づく低次の時系列データとを照合して照合結果に基づいて音声認識をすることを特徴とする音声認識装置。
IPC (2件):
G10L 3/00 515 ,  G10L 7/08
FI (2件):
G10L 3/00 515 A ,  G10L 7/08 A
引用特許:
審査官引用 (2件)
  • 音素識別装置
    公報種別:公開公報   出願番号:特願平3-227527   出願人:富士通株式会社
  • 特開平2-285707

前のページに戻る