特許
J-GLOBAL ID:200903073259725464

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2002-353914
公開番号(公開出願番号):特開2004-184856
出願日: 2002年12月05日
公開日(公表日): 2004年07月02日
要約:
【課題】本発明は、音声認識装置に関し、入力される音声の認識率を高く維持することを目的とする。【解決手段】入力マイク12に入力された音声及び騒音を静的特徴パラメータ及びΔ特徴パラメータを用いてパラメータ化し、静的特徴パラメータについてのLPCケプストラム距離に重み係数αを乗じて得た値とΔ特徴パラメータについてのデルタケプストラム距離に重み係数βを乗じて得た値とを加算し、その加算距離が最小となる音素を最適な音素として選択する。この際、非音声区間における入力騒音の時間変動の分散が大きいほど、重み係数αを大きくしかつ重み係数β(=1-α)を小さくする。これにより、入力騒音の時間変動の分散が異なることに起因する音声の認識率の低下を抑制する。【選択図】 図1
請求項(抜粋):
入力音声を少なくとも時間に関して静的な特徴を捉える静的特徴パラメータと時間に関して動的な特徴を捉える動的特徴パラメータとを用いてパラメータ化し、所定辞書内のデータと比較することにより音声の認識を行う音声認識装置であって、 音声入力前において入力騒音のパワーの時間変動の分散の度合いを算出する騒音特徴算出手段と、 前記騒音特徴算出手段により算出された前記分散の度合いに応じて、前記静的特徴パラメータ及び前記動的特徴パラメータの各特徴パラメータに乗ずるそれぞれの重み係数を変更する重み係数変更手段と、 を備えることを特徴とする音声認識装置。
IPC (6件):
G10L15/10 ,  G10L15/00 ,  G10L15/02 ,  G10L15/14 ,  G10L15/20 ,  G10L15/28
FI (9件):
G10L5/06 B ,  G10L3/00 515E ,  G10L9/16 301A ,  G10L3/00 551Q ,  G10L7/08 A ,  G10L3/00 535 ,  G10L9/08 301A ,  G10L3/00 531G ,  G10L3/00 531P
Fターム (3件):
5D015FF04 ,  5D015HH00 ,  5D015KK02

前のページに戻る