特許
J-GLOBAL ID:200903050417154321
音声認識装置、音声認識方法、および音声認識プログラムを記録した記録媒体
発明者:
,
,
,
,
出願人/特許権者:
代理人 (1件):
小笠原 史朗
公報種別:公開公報
出願番号(国際出願番号):特願2000-282480
公開番号(公開出願番号):特開2002-091486
出願日: 2000年09月18日
公開日(公表日): 2002年03月27日
要約:
【要約】【課題】 入力音声のスペクトル特徴に応じて、周波数分解能を適応させる音声分析を行い、少ない特徴量でも効率的にスペクトル包絡の特徴を捉える音声認識装置、音声認識方法および音声認識プログラムを記録した記録媒体を提供する。【解決手段】 アナログ音声信号を入力し(ステップS10)、増幅し(S20)、デジタル音声信号に変換する(S30)。次に、フレーム毎に分割し(S40)、大局的な周波数的特徴であるスペクトル傾斜を算出する(S50)。そして、最適な周波数伸縮係数を求め(S60)、周波数分解能を適応的に変化させたスペクトル包絡に対応した、適応線形予測係数を算出する(S70)。次に、周波数重みと(S80)、周波数軸を補正し(S90)、適応線形予測係数を、ケプストラム係数に変換する(S100)。次に、ケプストラム係数と複数の標準モデルとの間の類似度を算出し、音声認識結果として出力する(S110)。
請求項(抜粋):
入力音声のスペクトル包絡を表す特徴量を用いて認識を行う音声認識装置であって、前記入力音声の周波数的特徴に基づいて、その周波数分解能を適応的に変化させた前記スペクトル包絡に対応する特徴量を算出する特徴量算出部と、前記特徴量を用いて、予め設定された複数の標準モデルとの間の類似度を算出し、最も前記類似度が大きい前記モデルを認識する音声認識部とを備える、音声認識装置。
IPC (9件):
G10L 15/20
, G10L 21/02
, G06F 3/16 320
, G10L 15/02
, H03M 7/30
, G10L101:023
, G10L101:027
, G10L101:04
, G10L101:14
FI (12件):
G06F 3/16 320 H
, H03M 7/30 B
, G10L101:023
, G10L101:027
, G10L101:04
, G10L101:14
, G10L 3/02 301 A
, G10L 5/06 A
, G10L 7/08 A
, G10L 9/02 301 A
, G10L 9/08 301 A
, G10L 9/16 301 A
Fターム (14件):
5D015AA05
, 5D015FF05
, 5D015HH04
, 5D015HH07
, 5J064AA02
, 5J064BA13
, 5J064BB03
, 5J064BC01
, 5J064BC02
, 5J064BC06
, 5J064BC11
, 5J064BC17
, 5J064BC27
, 5J064BD03
前のページに戻る