特許
J-GLOBAL ID:200903028614010808

音声認識装置、その音声認識方法及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 坂口 博 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願2002-072456
公開番号(公開出願番号):特開2003-280686
出願日: 2002年03月15日
公開日(公表日): 2003年10月02日
要約:
【要約】【課題】 突発的に発生する雑音や不規則に発生する雑音などのような急激な変化を伴う雑音に対しても十分に対処し、精度の高い音声認識を実現する。【解決手段】 音声HMM(隠れマルコフモデル)と雑音HMMとを合成して得られる合成HMMを用い、入力音声の音声フレームごとに、この入力音声の特徴量と合成HMMとのマッチングを取ることにより音声認識を行う。
請求項(抜粋):
所定の音声と、予め収録された音声データの音韻隠れマルコフモデルとのマッチングを取ることにより音声認識を行う音声認識装置において、認識対象である入力音声の特徴量を抽出する特徴量抽出部と、前記音声データの音韻隠れマルコフモデルと予め収録された雑音データの隠れマルコフモデルとを合成し合成モデルを作成する合成モデル作成部と、前記特徴量抽出部にて抽出された前記入力音声の特徴量と前記合成モデル作成部にて作成された前記合成モデルとのマッチングを取ることにより前記入力音声を認識する音声認識部とを備え、前記音声認識部は、前記入力音声における発話区間を区切る適当な区間ごとに当該入力音声の特徴量と前記合成モデルとのマッチングを取ることを特徴とする音声認識装置。
IPC (3件):
G10L 15/14 ,  G10L 15/06 ,  G10L 15/20
FI (3件):
G10L 3/00 535 C ,  G10L 3/00 531 Q ,  G10L 3/00 521 T
Fターム (2件):
5D015EE05 ,  5D015HH23
引用特許:
審査官引用 (2件)

前のページに戻る