特許
J-GLOBAL ID:200903058287338442
閉ループのマルチモードの混合領域の線形予測音声コーダ
発明者:
出願人/特許権者:
代理人 (1件):
鈴江 武彦 (外3名)
公報種別:公表公報
出願番号(国際出願番号):特願2001-564148
公開番号(公開出願番号):特表2003-525473
出願日: 2000年02月29日
公開日(公表日): 2003年08月26日
要約:
【要約】閉ループのマルチモードの混合領域の線形予測(mixed-domain linear prediction, MDLP)の音声コーダは、高レートの時間領域のコード化モードと、低レートの周波数領域のコード化モードと、コーダへ入力されたフレームの音声内容に基づいてコーダのコード化モードを選択する閉ループのモード選択機構とを含む。遷移音声(すなわち、無声音音声から有声音音声へ、またはその逆へ)のフレームは、高レートの時間領域コード化モード、例えばCELPコード化モードでコード化される。有声音音声のフレームは、低レートの周波数領域コード化モード、例えば高調波コード化モードでコード化される。位相パラメータは、周波数領域コード化モードによってコード化されず、その代わりに、例えば準位相モデルにしたがってモデル化される。周波数領域コード化モードでコード化される各音声フレームにおいて、初期位相値は、周波数領域コード化モードでコード化された直前の音声フレームの初期位相値になる。直前の音声フレームが時間領域コード化モードでコード化されたときは、現在の音声フレームの初期位相値は、直前の時間領域でコード化された音声フレームのデコードされた音声フレーム情報から計算される。周波数領域コード化モードでコード化される各音声フレームを、対応する入力音声フレームと比較して、性能尺度を得ることができる。性能尺度が所定の閾値よりも低いときは、入力音声フレームは時間領域コード化モードでコード化される。
請求項(抜粋):
少なくとも1つの時間領域コード化モードおよび少なくとも1つの周波数領域コード化モードをもつコーダと、 コーダに接続され、かつ音声プロセッサによって処理されるフレーム内容に基づいてコーダのコード化モードを選択するように構成されている閉ループのモード選択デバイスとを含むマルチモードの混合領域の音声プロセッサ。
IPC (7件):
G10L 19/00
, G10L 11/02
, G10L 11/06
, G10L 19/02
, G10L 19/04
, G10L 19/12
, H03M 7/36
FI (7件):
H03M 7/36
, G10L 9/18 A
, G10L 7/04 F
, G10L 9/14 J
, G10L 9/14 S
, G10L 9/14 C
, G10L 9/14 D
Fターム (8件):
5D045CA01
, 5D045CC08
, 5D045DA20
, 5J064AA01
, 5J064BA16
, 5J064BB03
, 5J064BC16
, 5J064BC25
引用特許:
審査官引用 (8件)
-
音声合成方法
公報種別:公開公報
出願番号:特願平7-250983
出願人:ソニー株式会社
-
特許第2759646号
-
特開平2-288739
-
特許第2759646号
-
特開平2-288739
-
位相量子化装置及び方法
公報種別:公開公報
出願番号:特願平10-041095
出願人:ソニー株式会社
-
音声合成方法
公報種別:公開公報
出願番号:特願平9-019085
出願人:ソニー株式会社
-
特開平2-204800
全件表示
前のページに戻る