特許
J-GLOBAL ID:200903058287338442

閉ループのマルチモードの混合領域の線形予測音声コーダ

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦 (外3名)
公報種別:公表公報
出願番号(国際出願番号):特願2001-564148
公開番号(公開出願番号):特表2003-525473
出願日: 2000年02月29日
公開日(公表日): 2003年08月26日
要約:
【要約】閉ループのマルチモードの混合領域の線形予測(mixed-domain linear prediction, MDLP)の音声コーダは、高レートの時間領域のコード化モードと、低レートの周波数領域のコード化モードと、コーダへ入力されたフレームの音声内容に基づいてコーダのコード化モードを選択する閉ループのモード選択機構とを含む。遷移音声(すなわち、無声音音声から有声音音声へ、またはその逆へ)のフレームは、高レートの時間領域コード化モード、例えばCELPコード化モードでコード化される。有声音音声のフレームは、低レートの周波数領域コード化モード、例えば高調波コード化モードでコード化される。位相パラメータは、周波数領域コード化モードによってコード化されず、その代わりに、例えば準位相モデルにしたがってモデル化される。周波数領域コード化モードでコード化される各音声フレームにおいて、初期位相値は、周波数領域コード化モードでコード化された直前の音声フレームの初期位相値になる。直前の音声フレームが時間領域コード化モードでコード化されたときは、現在の音声フレームの初期位相値は、直前の時間領域でコード化された音声フレームのデコードされた音声フレーム情報から計算される。周波数領域コード化モードでコード化される各音声フレームを、対応する入力音声フレームと比較して、性能尺度を得ることができる。性能尺度が所定の閾値よりも低いときは、入力音声フレームは時間領域コード化モードでコード化される。
請求項(抜粋):
少なくとも1つの時間領域コード化モードおよび少なくとも1つの周波数領域コード化モードをもつコーダと、 コーダに接続され、かつ音声プロセッサによって処理されるフレーム内容に基づいてコーダのコード化モードを選択するように構成されている閉ループのモード選択デバイスとを含むマルチモードの混合領域の音声プロセッサ。
IPC (7件):
G10L 19/00 ,  G10L 11/02 ,  G10L 11/06 ,  G10L 19/02 ,  G10L 19/04 ,  G10L 19/12 ,  H03M 7/36
FI (7件):
H03M 7/36 ,  G10L 9/18 A ,  G10L 7/04 F ,  G10L 9/14 J ,  G10L 9/14 S ,  G10L 9/14 C ,  G10L 9/14 D
Fターム (8件):
5D045CA01 ,  5D045CC08 ,  5D045DA20 ,  5J064AA01 ,  5J064BA16 ,  5J064BB03 ,  5J064BC16 ,  5J064BC25
引用特許:
審査官引用 (8件)
  • 音声合成方法
    公報種別:公開公報   出願番号:特願平7-250983   出願人:ソニー株式会社
  • 特許第2759646号
  • 特開平2-288739
全件表示

前のページに戻る