特許
J-GLOBAL ID:200903068838593037

音声処理方法と装置及びプログラム

発明者:
出願人/特許権者:
代理人 (8件): 鈴江 武彦 ,  河野 哲 ,  中村 誠 ,  蔵田 昌俊 ,  峰 隆司 ,  福原 淑弘 ,  村松 貞男 ,  橋本 良郎
公報種別:公開公報
出願番号(国際出願番号):特願2004-011111
公開番号(公開出願番号):特開2005-202335
出願日: 2004年01月19日
公開日(公表日): 2005年07月28日
要約:
【課題】マイクロフォンで検出された音声信号に対し、スピーカに出力される前に処理を施すことによって、スピーカから放射される音声の明瞭度を向上させる。【解決手段】A/D変換器11によりディジタル化された音声信号を窓掛け処理部12に入力してフレーム分割した後に、FFT13を経て対数スペクトル計算部14により対数スペクトルを計算し、対数スペクトルに対してIFFT15を施すことでケプストラム係数を生成した後、回帰係数計算部16-1〜16-nにより時間方向にケプストラム係数を見た場合の回帰係数を計算し、2乗平均部17により回帰係数の2乗平均(D値)を計算し、D値を閾値処理部18に通して音声信号の定常部を求め、求められた定常部に対して乗算器19により音声信号の振幅を抑圧し、D/A変換器20を介して出力する。【選択図】 図3
請求項(抜粋):
入力された音声信号に対してスピーカに出力される前に処理を施す音声処理方法であって、 前記音声信号に対して窓掛け処理を行って該音声信号を複数のフレームに分割するステップと、 分割された各フレームの音声信号について対数スペクトルを計算するステップと、 前記対数スペクトルからケプストラム係数を計算するステップと、 前記ケプストラム係数を時間方向に見た場合の回帰係数を計算するステップと、 前記回帰係数の2乗平均を求めるステップと、 前記2乗平均について閾値処理を行うことにより前記音声信号の定常部を求めるステップと、 前記定常部について前記音声信号の振幅を抑圧するステップとを具備することを特徴とする音声処理方法。
IPC (4件):
G10L21/04 ,  G10L11/00 ,  H04R3/00 ,  H04R27/00
FI (4件):
G10L3/02 A ,  H04R3/00 310 ,  H04R27/00 E ,  G10L7/06
Fターム (2件):
5D020AC06 ,  5D045BA01
引用特許:
審査官引用 (2件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願2000-164077   出願人:松下電器産業株式会社
  • 波形分析方法
    公報種別:公開公報   出願番号:特願平11-276697   出願人:ヤマハ株式会社
引用文献:
前のページに戻る