Pat
J-GLOBAL ID:200903085526627440

音声認識装置

Inventor:
Applicant, Patent owner:
Agent (1): 小鍜治 明 (外2名)
Gazette classification:公開公報
Application number (International application number):1991314248
Publication number (International publication number):1993150797
Application date: Nov. 28, 1991
Publication date: Jun. 18, 1993
Summary:
【要約】【目的】 本発明は不特定話者を対象とした音声認識装置に関するもので、認識性能が優れ、しかも語彙の変更や登録を容易に行うことができる音声認識装置を提供することを目的とする。【構成】 音響分析部11と、特徴パラメータ抽出部12と、音声片標準パターン格納部15と、全認識対象単語を音声片の並びで記述した単語辞書16と、音声片の並びに従って音声片標準パターンを選択し連結することにより認識対象語彙の単語標準パターンを生成する単語標準パターン生成部17と、複数のフレームで形成された入力ベクトルと認識対象音声の部分パターンとの部分距離を事後確率に基づく統計的距離尺度で求める部分距離計算部18と、入力フレームをシフトしながら音声全体にわたって部分距離を累積することにより入力音声と単語標準パターンとの距離を求める距離累積部19と、累積距離を最小とする音声名を認識結果とする判定部111とから構成される。
Claim (excerpt):
入力音声信号を分析の基本単位であるフレーム毎に分析し分析パラメータを抽出する音響分析手段と、分析フレームの前後の複数フレームにわたる上記分析パラメータ列を統合したベクトルを当該フレームにおける特徴パラメータベクトルとして得る特徴パラメータ抽出手段と、予め多数の人が発声した音声データを用いて音声認識の基本単位(音声片と記す)の一部を表現する部分パターンを、音声片全体をカバーできるように複数種類作成し、複数種類の部分パターンを連接して構成するという方法で作成された音声片標準パターンを格納する音声片標準パターン格納手段と、全認識対象単語を音声片の並びで記述してある単語辞書と、上記単語辞書に記述されている認識対象単語の音声片の並びに従って音声片標準パターンを選択して連結することにより認識対象語彙の部分パターンの系列を単語標準パターンとして生成する単語標準パターン生成手段と、入力ベクトルと単語標準パターンの一部である部分パターンとの部分距離を統計的距離尺度で計算する部分距離計算手段と、上記計算を、一定時間長(フレーム)をシフトしながら次々と形成した入力ベクトルと前記連接した部分パターンとの間で逐次行なってゆき、計算された部分距離を累積することによって入力音声と単語標準パターンとの距離を求める距離累積手段と、入力音声の終了時点で全認識対象単語の単語標準パターンに対する距離を相互に比較し、上記距離が最小となる単語標準パターンに対応する音声名を認識結果とする判定手段とを具備することを特徴とする音声認識装置。
IPC (3):
G10L 3/00 531 ,  G10L 3/00 521 ,  G10L 5/06
Patent cited by the Patent:
Cited by examiner (3)
  • 特開平2-083595
  • 特開昭59-173884
  • 特開昭59-195699

Return to Previous Page