特許
J-GLOBAL ID:201303016426897140
MDCTスペクトルの組み合せエンコーディングを使用する、スケーラブルなスピーチおよびオーディオエンコーディング
発明者:
,
出願人/特許権者:
代理人 (16件):
蔵田 昌俊
, 福原 淑弘
, 中村 誠
, 野河 信久
, 白根 俊郎
, 峰 隆司
, 幸長 保次郎
, 河野 直樹
, 砂川 克
, 井関 守三
, 赤穂 隆雄
, 井上 正
, 佐藤 立志
, 岡田 貴志
, 堀内 美保子
, 竹内 将訓
公報種別:公開公報
出願番号(国際出願番号):特願2013-083340
公開番号(公開出願番号):特開2013-178539
出願日: 2013年04月11日
公開日(公表日): 2013年09月09日
要約:
【課題】スケーラブルなスピーチおよびオーディオ圧縮アルゴリズムにおける、MDCT(または、類似の変換ベースの)スペクトルのエンコーディング/デコーディングのための効率的な技術を提供する。【解決手段】元のオーディオ信号と、元のオーディオ信号の再構成されたバージョンとの間の差である残差信号が、コード励振線形予測(CELP)ベースのエンコーディングレイヤから取得され、離散コサイン変換(DCT)タイプの変換レイヤにおいて変換されて、複数のスペクトル線を有する対応する変換スペクトルが取得される。変換スペクトルのスペクトル線は、組み合せ位置コード化技術を使用して変換される。組み合せ位置コード化技術は、選択されたサブセットのスペクトル線に対する辞書式インデックスを発生せ、各辞書式インデックスは、選択されたサブセットのスペクトル線の位置を表している複数の可能性のあるバイナリストリングのうちの1つを表す。【選択図】図8
請求項(抜粋):
スケーラブルなスピーチおよびオーディオコーデック中でエンコードする方法において、
コード励振線形予測(CELP)ベースのエンコーディングレイヤから残差信号を取得し、前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号の再構成されたバージョンとの間の差であることと、
離散コサイン変換(DCT)タイプの変換レイヤにおいて前記残差信号を変換して、複数のスペクトル線を有する対応する変換スペクトルを取得することと、
組み合せ位置コード化技術を使用して、前記変換スペクトルのスペクトル線をエンコードすることとを含む方法。
IPC (3件):
G10L 19/16
, G10L 25/18
, H03M 7/30
FI (4件):
G10L19/14 400Z
, G10L19/14 400F
, G10L11/00 101E
, H03M7/30 A
Fターム (3件):
5J064BA16
, 5J064BB01
, 5J064BB03
前のページに戻る