特許
J-GLOBAL ID:200903040474027675

音声信号をコード化、操作及びデコード化する方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 川原田 一穂
公報種別:公表公報
出願番号(国際出願番号):特願平9-516296
公開番号(公開出願番号):特表平10-512423
出願日: 1996年10月25日
公開日(公表日): 1998年11月24日
要約:
【要約】本方法及び装置により、特定の信号内容に依存することなく音声信号のコード化、操作及びデコード化が可能になる。エンコーダー(AC)はオブジェクト向きコード化を行い、可変のビットレート及びバンド幅を有し且つ各オブジェクトに対して1基本層と1以上のエンハンス層から成るコード化信号を発生する。エンコーダー(AC)は、専用アルゴリズム及び標準化された任意のアルゴリズム両方に従って動作し、コード化されるべきオブジェクトに依存して最も有利なアルゴリズムを選択できる。デコーダー(AD)に向かう伝送経路に沿ったビットストリーム操作装置により、コード化信号のビットレート又はバンド幅のスケーリングが、又は個々のオブジェクトに作用することでコード化信号のパラメータを変えることが可能となる。
請求項(抜粋):
1 デジタル化音声信号を処理する方法であって、(ア)コード化フェーズであって、処理されて所定数のサンプルから成る一連のフレームに編成されるべき信号が、独立にコード化され得る複数の周波数バンドに分離され、コード化信号は、前記周波数バンドの少なくとも選択されたもの内の信号に関連した情報を含んで発生され、コード化は埋込コード化技術に従って行われ、その結果、コード化信号は、基本層、トータル層及び複数の中間層を含み、該基本層はデコード化に必要な最小量の情報(「コアー情報」)を含み且つ最小ビットレートに対応し、該トータル層はコード化情報の全体を含み且つ最大ビットレートに対応し、該中間層はそれぞれの情報ブロック(「エンハンス情報」)によりコード化信号に寄与し且つ基本層からトータル層への連続ステップによりコード化信号のビットレートを増加させる、上記コード化フェーズ、及び(イ)デコード化フェーズであって、コード化信号に含まれる周波数バンド内の信号に関する情報が独立にデコード化され、異なるバンドに関するデコード化信号が再結合されて元の信号のバンド幅特性に対応したバンド幅特性を有する再構成信号を作る、上記デコード化フェーズ、を少なくとも含み、前記コード化フェーズにおいて各フレームでは、(A)少なくとも前記選択された周波数バンドの信号は第1コード化ステップに伝送され、該第1コード化ステップはコアー情報を発生し且つ複数の第1コード化アルゴリズムから選択された第1コード化アルゴリズムにより実行され、そして、上記信号は大抵の場合1つの又は複数の第2コード化ステップに伝送され、各第2コード化ステップは、コアー情報のみによっては表せない信号部分をコード化してエンハンス情報の1ブロックを発生し、且つ複数の第2コード化アルゴリズムから選択された第2コード化アルゴリズムにより実行され、(B)複数のそれぞれの前記第1及び第2コード化アルゴリズムからの選択は、2ステージ分類の結果に依存し、それにより所与のフレーム内の信号は複数の抽象クラスのうちの一つ及び前記1抽象クラスの複数の具体クラスのうちの一つに割り当てられ、(C)複数のそれぞれの前記第1及び第2コード化アルゴリズムからの選択は、ユーザー(US)からコード化デバイス(AC)に送られる構成情報に依存し、(D)複数のそれぞれの前記第1及び第2コード化アルゴリズムからの選択は、伝送システムからコード化デバイスの送られる制御情報に依存し、また、前記デコード化フェーズにおいて各フレームでは、(E)両方のエンハンス情報ブロックとコアー情報が存在する周波数バンドのコード化信号は、1組の第1デコード化ステップに伝送され、該ステップ数はそのバンドに対して行われる第2コード化ステップの数と同じでありその各々において1エンハンス情報ブロックがデコード化され、そして上記コード化信号は、第2デコード化ステップに伝送されてコアー情報がデコード化され、一方、コアー情報のみが存在する周波数バンドのコード化信号は、第2デコード化ステップのみに伝送され、各第1デコード化ステップは、コード化フェーズで選択された第2アルゴリズムと相補的な夫々のアルゴリズムにより実行されてそのステップでデコード化されるべきエンハンス情報ブロックを発生し、また、第2デコード化ステップは第1コード化ステップで選択された第1アルゴリズムと相補的なアルゴリズムに従って実行され、(F)前記第1及び第2デコード化アルゴリズムの各々は、抽象及び具体クラス分類を有する情報に従って、前記第2及び第1コード化アルゴリズムの一つと各々が相補的な複数の第1及び第2デコード化アルゴリズムから選択され、(G)前記第1及び第2デコード化アルゴリズムの各々は、セットアップフェーズで与えられる構成情報に従って、前記第2及び第1コード化アルゴリズムの一つと各々が相補的な複数の第1及び第2デコード化アルゴリズムから選択される、ことを特徴とする上記デジタル化音声信号を処理する方法。2 第1及び第2アルゴリズムは異なるバンドに対して独立に選択されることを特徴とする請求の範囲第1項記載の方法。3 第2コード化アルゴリズムは、第1コード化アルゴリズムの適用の結果として得られる量子化エラーをコード化することを特徴とする請求の範囲第1項又は第2項記載の方法。4 第1アルゴリズムは、少なくともより低い周波数バンドの組の信号に対する線形予測分析コード化アルゴリズム、並びにより高い周波数バンドの信号及び線形予測が用いられない信号に対する形状/利得ベクトル量子コード化アルゴリズムを含むことを特徴とする請求の範囲第1項乃至第3項のいずれか1項に記載の方法。5 第2アルゴリズムは形状/利得ベクトル量子コード化アルゴリズムを含むことを特徴とする請求の範囲第1項乃至第4項のいずれか1項に記載の方法。6 コード化信号のビットレートは複数のビットレートから選択可能であることを特徴とする請求の範囲第1項乃至第5項のいずれか1項に記載の方法。7 コード化の前に各フレームは複数のサブフレームに分割され、前記サブフレームの長さは、コード化遅延の複数の可能な値を得られるように、複数の長さ値から選択できることを特徴とする請求の範囲第1項乃至第6項のいずれか1項に記載の方法。8 前記周波数バンドは、コード化されるべき信号のサンプリング周波数とは独立に所定のバンド幅を有することを特徴とする請求の範囲第1項乃至第7項のいずれか1項に記載の方法。9 コード化されるべき信号は8から64kHzまでの任意の入力サンプリング周波数でサンプリングされ、コード化前に、それは入力サンプリング周波数よりすぐ上の2のべき乗である内部サンプリング周波数までアップサンプリングされ、また、アップサンプリングは8、16及び32kHzの入力サンプリング周波数に対しては機能しないことを特徴とする請求の範囲第1項乃至第8項のいずれか1項に記載の方法。10 スピーチ信号処理に対してコード化フェーズは、(A)周波数バンドの全体の組に対する第1コード化アルゴリズムとして、標準とされるスピーチコード化アルゴリズムを選択するステップ、(B)標準とされるアルゴリズムにスピーチ信号を伝送することにより発生されるコアー情報で基本層を構築するステップ、及び(C)標準とされるコード化信号に対して更新されたコード化信号を得るように、前記中間層の一つ又はトータル層に対応するコード化信号を構築するステップ、を含み、また、デコード化フェーズは、a)基本層のみをデコード化するステップ、又はb)デコード化アルゴリズムの可用性、及び/又はデコード化信号に対して得られるべき品質に依存して、コード化信号全体をデコード化するステップ、を含むことを特徴とする請求の範囲第1項乃至第9項のいずれか1項に記載の方法。11 少なくとも第1コード化ステップに伝送されるべき周波数バンドの選択に対して、第2コード化ステップも実行され、所与の周波数バンドに対する第2コード化ステップ数が、コード化信号に求められるバンド幅及びビットレートに依存しユーザーやシステムの要求に従って決められ、コード化信号は、1フレームベース当たり1フレーム上に、コード化される信号のバンド幅及びサンプリング周波数とは独立に利用されることを特徴とする請求の範囲第1項乃至第10項のいずれか1項に記載の方法。12 第1コード化ステップに伝送されるべき周波数バンドの選択は、a)利用可能なビットレートについてコード化信号に割り当て可能な総バンド幅を決める操作、b)前記バンド幅に含まれる各バンドに関連するエネルギーを決め、前記エネルギーをそれぞれの第1エネルギー閾値と比較する操作、c)エネルギーが夫々の閾値を越える全てのバンドに対してコアー情報の挿入をイネーブルする操作、により実行されることを特徴とする請求の範囲第1項乃至第11項のいずれか1項に記載の方法。13 閾値は定数閾値であることを特徴とする請求の範囲第12項記載の方法。14 閾値は知覚モデルを用いて決められた閾値であることを特徴とする請求の範囲第12項記載の方法。15 前記第2コード化ステップが適用されるバンドの選択、及び所与のバンドに対する第2コード化ステップ数の決定は、d)各バンドに対して第2コード化ステップ全てを適用する操作、e)前回のステップに対する、又は同じバンド内での第1コード化ステップに対する、各第2ステップにより与えられる信号品質の向上を決める操作、f)最高の品質向上をもたらす第2コード化ステップにより与えられる、エンハンス情報ブロックのコード化信号内への挿入を、利用可能ビットレートが完全に使用されるまでイネーブルする操作、を含むことを特徴とする請求の範囲第1項乃至第14項のいずれか1項に記載の方法。16 品質向上の前記評価が知覚モデルを用いて行われることを特徴とする請求の範囲第15項記載の方法。17 前記音声信号がマルチメディア信号の音声成分であることを特徴とする請求の範囲第1項乃至第16項のいずれか1項に記載の方法。18 コード化されるべき音声信号は前記2ステージ分類に伝送され、所与のフレーム内の信号が複数の抽象クラスからの1つ及び前記1抽象クラスの複数の具体クラスからの1つに割り当てられ、該分類は、周波数バンド内への前記分離のために制御パラメータとして用いられ、周波数バンドの前記選択に対して第1コード化アルゴリズム及び多くの場合第2コード化アルゴリズムが適用され、所与の周波数バンドに対して第2コード化ステップ数が決められることを特徴とする請求の範囲第1項乃至第17項のいずれか1項に記載の方法。19 さらにビットストリーム構成フェーズを含み、該フェーズでは各フレームにおいて及びコード化される各音声信号に対して、個々のコード化ステップにより作られたビットのパケットが、オブジェクトビットストリーム内に共にグループ化され、該オブジェクトビットストリームは、そのフレーム内の該音声信号に対する同じ具体クラスについての全情報を含み、また、前記フレーム内の前記音声信号の異なるオブジェクトのビットストリームが、マクロオブジェクトビットストリーム(OB11...OB21)内に共にグループ化され、 分類結果及び少なくとも第1コード化ステップに伝送される周波数バンドに関する情報を含んだオーバーヘッドビットの第1グループ(OVH1,OVH2);コアー情報のパケット;及び第2コード化ステップが実行されたならば、少なくとも第1コード化ステップに伝送された異なる周波数バンドに対して実行されたコード化ステップ数、及びエンハンス情報ブロックのパケットに関する情報を含んだオーバーヘッドビットの第2グループ(OVH3)を含み、 フレーム内でコード化された異なるマクロオブジェクトのビットストリーム(OB11...OB21)が順に伝送され、該伝送は構成フェーズにより進められ、該フェーズではオーバーヘッドビットの別のグループ(OVH0)が伝送され、該グループはデコーダー(AD)の構成に必要な全てのサービス情報を含む、ことを特徴とする請求の範囲第1項乃至第18項のいずれか1項に記載の方法。20 マクロオブジェクト内のビットパケットは周波数バンドにより配列されることを特徴とする請求の範囲第19項記載の方法。21 マクロオブジェクトビットストリーム内のビットパケットはランクにより配列され、該ランクは、パケットがコアー情報及び品質向上に属する場合、パケットがエンハンス情報に属する場合、異なるバンドのエネルギー値に関係することを特徴とする請求の範囲第19項記載の方法。22 さらにビットストリーム操作フェーズを含み、該フェーズは、階段状ビットレート及びコード化信号のバンド幅スケーリングのために、コーダー(AC)とデコーダー(AD)間の伝送経路(1)に沿って1又は複数の場所にて実行され、各スケーリングステップは、1つのエンハンス情報ブロックの抑制、又はエンハンス情報ブロックがコード化信号に存在しない場合は周波数バンドのコアー情報の抑制に対応することを特徴とする請求の範囲第1項乃至第21項のいずれか1項に記載の方法。23 前記スケーリングが個々のオブジェクト又はマクロオブジェクトのビットストリーム上で実行されることを特徴とする請求の範囲第22項記載の方法。24 前記スケーリングが、a1)フレームにおいて所望のビットレートに対する該又は各々のマクロオブジェクトに割り当て可能なバンド幅を決めるステップ、b1)前記バンド幅を越える周波数バンドに関するビットパケットを除去するステップ、c1)残差ビットレートが所望のビットレートを越えるならば、所望のビットレートが達成されるか又はコアー情報のみが残されるまで、最高周波数を有するバンドから開始して、各バンドに対するエンハンス情報の1ブロックを除去し、必要なら該除去は周期的に繰り返されるステップ、d1)ステップc1)の終わりでの残差ビットレートがなお所望のビットレートを越えるならば、最高周波数バンドから開始して、1以上の周波数バンドのコアーパケットを除去するステップ、を含むことを特徴とする、請求の範囲第20項を参照するならば請求の範囲第22項及び第23項に記載の方法。25 前記スケーリングが、a2)フレームにおいて所望のビットレートに対する該又は各々のマクロオブジェクトに割り当て可能な総バンド幅を決めるステップ、b2)前記バンド幅を越える周波数バンドに関するビットパケットを除去するステップ、c2)残差ビットレートが所望のビットレートを越えるならば、所望のビットレートが達成されるか又はコアー情報のみが残されるまで、最低ランクを有するパケットから開始して、エンハンス情報の1パケットを一度に除去するステップ、d2)ステップc2)の終わりでの残差ビットレートがなお所望のビットレートを越えるならば、最低ランクバンドから開始して、1以上の周波数バンドのコアー情報を除去するステップ、を含むことを特徴とする、請求の範囲第21項を参照するならば請求の範囲第22項及び第23項に記載の方法。26 前記ビットストリーム操作フェーズは、個々のマクロオブジェクトにおける所定のコード化パラメータの値を変えるステップを含むことを特徴とする請求の範囲第22項乃至第25項のいずれか1項に記載の方法。27 前記ビットストリーム操作フェーズは、異なるビットレート及び/又はバンド幅を異なるマクロオブジェクトに割り当てるように、複数のコンカレントマクロオブジェクト上に同時に実行されることを特徴とする請求の範囲第22項乃至第26項のいずれか1項に記載の方法。28 前記ビットストリーム操作フェーズは、ビットレート全体が所定のビットレートを越える複数のコンカレントマクロオブジェクトからの寄与を含んで、所定のビットレートにて単一ビットストリームを構築するステップを含むことを特徴とする請求の範囲第27項記載の方法。29 前記ビットストリーム操作フェーズは、個々のマクロオブジェクト上にレベル操作を実行するステップを含み、また、個々のマクロオブジェクトに割り当てられた異なるビットレート及び/又はバンド幅はそのレベル操作を基にして選択されることを特徴とする請求の範囲第27項又は第28項記載の方法。30 前記ビットストリーム操作フェーズは個別に選択されたフレーム上で実行されることを特徴とする請求の範囲第22項乃至第29項のいずれか1項に記載の方法。31 デジタル音声信号を処理する装置であって、(ア)バンド幅特性の与えられたコード化されるべき音声信号のサンプルフレームを受信するよう構成されたエンコーダー(AC)であって、 コード化すべき信号を複数の周波数バンドに分離するフィルタリング手段(FB1,FB2,FB3)、 そのバンドの信号の埋込コード化のための各周波数バンドに関連したコード化装置(LCC,HCC,LEC,HEC)、及び 異なる周波数バンドのコード化信号を単一埋込コード化信号内に結合する手段(BCU)であって、基本層、トータル層及び複数の中間層を含み、該基本層は、信号デコード化に必要な最小量の情報(「コアー情報」)を含み且つ最小ビットレートに対応し、トータル層は、コード化情報の全体を含み且つ最大ビットレートに対応し、中間層は、それぞれの情報ブロック(「エンハンス情報」)によりコード化信号に寄与し且つ基本層からトータル層への連続ステップによりコード化信号のビットレートを増加させる、上記手段(BCU)、を含む上記エンコーダー(AC)、並びに(イ)異なる周波数バンドのコード化信号を独立にデコード化するデコード化装置(LED,HED,LCD,HCD)、及び異なる周波数バンドのデコード化信号を再結合し且つ元の音声信号のバンド幅特性に対応するバンド幅特性を有するデコード化信号を再構成する合成フィルター手段(FB4,FB5,FB6)から成るデコーダー(AD)、を含み、 各バンドのコード化装置(LCC,HCC,LEC,HEC)は、第1コード化装置(LCC,HCC)及び第2コード化装置の組(LCC,HCC)を含み、該第1コード化装置は、周波数バンドの少なくとも選択されたものに対してイネーブルされ、そのバンドに対するコアー情報を各フレームにて発生し、該第2コード化装置は、そのバンドに対する一連のエンハンス情報ブロックを発生し、前記選択された周波数バンドに関連した第2コード化装置(LEC,HEC)のみがイネーブルされてそれぞれのエンハンス情報ブロックをコード化信号内に導入し、第1コード化装置(LCC,HCC)及び各第2コード化装置(LEC,HEC)は、コード化されている信号に対して、複数の第1及び第2コード化アルゴリズムから選択されたそれぞれの第1又は第2コード化アルゴリズムを適用すべく、構成でき、 また、各バンドのデコード化装置(LED,HED,LCD,HCD)は、1組の第1デコード化装置(LED,HED)と第2デコード化装置(LCD,HCD)を含み、第1デコード化装置は前記第2組のコード化装置(LEC,HEC)と1対1対応し且つその各々はエンハンス情報ブロックをデコード化し、第2デコード化装置は、コアー情報をデコード化し、各々の第1デコード化装置(LED,HED)及び第2デコード化装置(LCD,HCD)は、デコード化されている信号に、第2及び第1コード化装置(LEC,HEC,LCC,HCC)によりそれぞれ与えられる第2及び第1コード化アルゴリズムと相補的な第1又は第2デコード化アルゴリズムをそれぞれ適用すべく、構成できる、ことを特徴とする上記デジタル音声信号を処理する装置。32 前記エンコーダー(AC)は8から64kHzまでの任意の入力サンプリング周波数にてサンプリングされた信号を受信し、さらに入力サンプリング周波数よりすぐ大きい2のべき乗である内部サンプリング周波数にて前記信号をアップサンプリングするための手段(MXU)を含み、前記アップサンプリング手段(MXU)は8、16及び32kHzの入力サンプリング周波数に対して作動しないことを特徴とする請求の範囲第31項記載の装置。33 エンコーダー(AC)内の前記フィルター手段(FB1...FB3)は、コード化されるべき信号のサンプリング周波数とは独立に所定のバンド幅の周波数バンドを発生するように構成できることを特徴とする請求の範囲第31項又は第32項記載の装置。34 エンコーダー(AC)は、複数のサブフレーム内に・・・
IPC (4件):
H04B 1/66 ,  G10L 9/18 ,  H03M 7/30 ,  H04B 14/04
FI (4件):
H04B 1/66 ,  G10L 9/18 A ,  H03M 7/30 Z ,  H04B 14/04 Z

前のページに戻る