Pat
J-GLOBAL ID:200903092734324288
音声認識装置
Inventor:
Applicant, Patent owner:
Agent (1):
千葉 剛宏 (外1名)
Gazette classification:公開公報
Application number (International application number):1997323027
Publication number (International publication number):1999065589
Application date: Nov. 25, 1997
Publication date: Mar. 09, 1999
Summary:
【要約】【課題】簡単な横成で、不特定話者の発話の多様性に対しても高性能を維持することができて、誤認識を低減させた音声認識装置を提供する。【解決手段】音声信号を周波数分析して得た周波数スペクトルを、時間軸に沿って順次求めて時系列データ群に変換する周波数分析器2に、複数の学習話者からの音声信号が入力されたとき周波数分析器2から出力される時系列データを部分周波数-時間パターン作成器3によって予め定めた時間窓で切り出し、切り出された時系列データ群を主成分分析器4によって主成分分析した主成分に基づき入力時系列データを低次の時系列データに特徴抽出フィルタ5にて圧縮する。複数の学習話者からの音声信号を低次の時系列データに圧縮した参照用低次圧縮時系列データと、不特定話者からの音声信号を圧縮した低次の時系列データとを照合して、照合結果に基づいて不特定話者からの音声を認識する。
Claim (excerpt):
音声信号を周波数分析して得た周波数スペクトルを、時間軸に沿って順次求めて時系列データ群に変換する周波数分析手段と、複数の学習話者から発話された音声に基づく音声信号が入力された前記周波数分析手段からの出力時系列データを予め定めた時間窓で切り出す切り出し手段と、前記切り出し手段によって切り出された時系列データ群を用いて主成分分析を行う主成分分析手段と、前記主成分分析により得た主成分に基づき入力時系列データを低次の時系列データに圧縮する特徴抽出フィルタ手段とを備え、前記複数の学習話者から発話された音声に基づく低次の時系列データを参照用低次時系列データとし、該参照用低次時系列データと不特定話者から発話された音声に基づく低次の時系列データとを照合して照合結果に基づいて音声認識をすることを特徴とする音声認識装置。
IPC (2):
G10L 3/00 515
, G10L 7/08
FI (2):
G10L 3/00 515 A
, G10L 7/08 A
Patent cited by the Patent:
Cited by examiner (2)
-
音素識別装置
Gazette classification:公開公報
Application number:特願平3-227527
Applicant:富士通株式会社
-
特開平2-285707
Return to Previous Page