特許
J-GLOBAL ID:201703007741825212

広義知覚類似性(wide-sense perceptual similarity)を使用するデジタルメディアスペクトルデータの効率的な復号

発明者:
出願人/特許権者:
代理人 (5件): 小野 新次郎 ,  小林 泰 ,  竹内 茂雄 ,  山本 修 ,  上田 忠
公報種別:公開公報
出願番号(国際出願番号):特願2016-171531
公開番号(公開出願番号):特開2017-037311
出願日: 2016年09月02日
公開日(公表日): 2017年02月16日
要約:
【課題】全部より少ないスペクトル係数を符号化することによってコーディングビットレートを保存することがあり、再構築時に、ぼやけた、低域通過した音が生成される可能性がある。【解決手段】広義知覚類似性を使用するオーディオエンコーダは、すでにコード化されているスペクトルのスケーリングされたバージョンとして表された、省略されたスペクトル係数の知覚的に類似のバージョンを符号化する。省略されたスペクトル係数は、いくつかのサブバンドに分割され、サブバンドは、スケールファクタと、シェープパラメータとして符号化される。シェープパラメータは、すでにコード化されているスペクトルの一部分を指すモーションベクトル、固定コードブック内のスペクトル形状に対するインデックス、またはランダムノイズベクトルの形態にでき、復号時にスペクトルの似た形状の一部分のスケーリングされたバージョンが表される。【選択図】図1
請求項(抜粋):
エンコーダにおいて、符号化されたオーディオビットストリームを得るステップであって、 複数の拡張帯域の各々について、 1または複数のベースバンドスペクトル係数の部分のうちのいずれか、当該拡張帯域に形状がより似ているかを判定するために探索を実行し、 判定された前記部分が、当該拡張帯域に形状が十分似ているか判定し、 十分似ている場合に、当該拡張帯域を、判定された前記部分の前記形状のスケーリングされたバージョンとして符号化し、 十分似ていない場合に、 固定されたコードブック内で表された形状の中で、当該拡張帯域により似ている形状があるかどうか探索を実行し、 当該似ている形状が前記固定されたコードブック内で見出された場合に、当該拡張帯域を、前記固定されたコードブック内の当該似ている形状のスケーリングされたバージョンとして符号化し、 当該似ている形状が前記固定されたコードブック内で見出されない場合に、当該拡張帯域を、ランダムノイズベクトルのスケーリングされたバージョンとして符号化する ステップ を含む、ステップと、 デコーダにおいて、前記符号化されたオーディオビットストリームから1または複数のベースバンドスペクトル係数を復号するステップと、 前記デコーダにおいて、 スケーリングファクタを復号し、 コピーすべき1または複数のベースバンドスペクトル係数を識別するモーションベクトル、固定されたコードブックからのスペクトル形状のためのベクトル及び正規化されたランダムノイズベクトルの何れかが指定されるように構成されたシェープパラメータに応じて、1若しくは複数の識別されたベースバンドスペクトル係数、固定されたコードブックからのスペクトル形状のためのベクトルに対応する1若しくは複数の係数または正規化されたランダムノイズベクトルに対応する1若しくは複数の係数を選択的にコピーし、かつ 前記スケーリングファクタに応じて、コピーされた前記1または複数の係数をスケーリングすること により、複数の拡張帯域の各々における1または複数の拡張帯域スペクトル係数を復号するステップと を含む方法。
IPC (4件):
G10L 19/038 ,  H03M 7/30 ,  G10L 19/02 ,  H03M 7/40
FI (4件):
G10L19/038 ,  H03M7/30 A ,  G10L19/02 150 ,  H03M7/40
Fターム (4件):
5J064AA02 ,  5J064BA16 ,  5J064BB13 ,  5J064BC02

前のページに戻る