特許
J-GLOBAL ID:200903034033454160
音声信号レベル表示装置およびその方法
発明者:
出願人/特許権者:
代理人 (3件):
中尾 直樹
, 草野 卓
, 中村 幸雄
公報種別:公開公報
出願番号(国際出願番号):特願2007-100647
公開番号(公開出願番号):特開2008-257042
出願日: 2007年04月06日
公開日(公表日): 2008年10月23日
要約:
【課題】各種装置等に音声信号を入力する際、ユーザに対して入力音声信号の大きさだけでなく、品質情報についても提示し、その提示情報に応じてユーザ自らが入力環境を適切に改善できるようにする。 【解決手段】音声信号入力部101から入力された音声信号のゲインを入力ゲイン調整部102で適正レベルに調整し、A/D変換部103でディジタル信号に変換し、このディジタル信号について一定時間ごとに切り出したフレームごとに、第1信号レベル計算部104で第1信号レベルを計算するとともに、音声尤度計算部107でスペクトル特徴量計算部105において求めた上記ディジタル信号の特徴量とクリーン音声信号の確率モデル(GMM)パラメータとから音声尤度値を計算する。そして、同一フレームの上記第1信号レベルと上記音声尤度値とを表示部108に表示する。【選択図】図1
請求項(抜粋):
入力された音声信号のレベルを表示する音声信号レベル表示装置であり、
音声信号が入力され、ゲインを調整して処理に適正なレベルで信号を出力する入力ゲイン調整部と、
上記信号が入力され、ディジタル信号に変換して出力するA/D変換部と、
上記ディジタル信号が入力され、これを短時間窓で切り出したフレームごとに信号の大きさを計算して第1信号レベルを出力する第1信号レベル計算部と、
上記ディジタル信号が入力され、これを上記短時間窓で切り出したフレームごとにスペクトル特徴量を計算して出力するスペクトル特徴量計算部と、
クリーン音声信号の複数の正規分布を含有する混合正規分布に基づく確率モデル(GMM:Gaussian Mixture Model)パラメータを記憶する音声モデル格納部と、
上記スペクトル特徴量が入力され、上記確率モデルパラメータを用いて音声尤度値を計算して出力する音声尤度計算部と、
上記第1信号レベルと上記音声尤度値とが入力され、その両方を上記フレームごとに同時に表示する第1表示部と、
を具備することを特徴とする音声信号レベル表示装置。
IPC (3件):
G10L 21/06
, G10L 11/00
, G10L 21/02
FI (6件):
G10L21/06 200Z
, G10L11/00 405
, G10L11/00 101F
, G10L21/02 101B
, G10L11/00 402L
, G10L11/00 201Z
引用特許:
出願人引用 (1件)
審査官引用 (9件)
全件表示
前のページに戻る