特許
J-GLOBAL ID:200903042012825048

予測符号化における人間聴覚モデルを使用した音声信号量子化法

発明者:
出願人/特許権者:
代理人 (1件): 岡部 正夫 (外9名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-247609
公開番号(公開出願番号):特開平9-152900
出願日: 1996年09月19日
公開日(公表日): 1997年06月10日
要約:
【要約】【課題】 改良された音声信号、オーディオ信号の圧縮(符号化)の技術を提供する。【解決手段】 「変換予測符号化」ないしTPCと称される音声圧縮システムは、7kHzの帯域幅の音声(16kHzサンプリング)を、16から32kb/s(1から2ビット/サンプル)の目標ビット速度範囲で符号化するために設けられる。このシステムは、会話中の冗長度を取り除くために、短期および長期の予測を使用している。予測残差は、人間の聴覚知覚における知識を利用して周波数領域に変換され符号化される。TPC符号化器は、開ループの量子化だけを使用し、よって、複雑さが著しく解消される。TPCの音声品質は、32kb/sにおいて明白であり、24kb/sにおいて非常に良好であり、また16kb/sにおいて受容可能なものである。
請求項(抜粋):
音声情報を表す信号を符号化する方法において、音声情報を表す信号の推定値を表す第1の信号を発生し、音声情報を表す信号を第1の信号と比較して前記比較された各信号の間の差を表す第2の信号を形成し、人間音声知覚のモデルにより決定された知覚ノイズマスキング信号に従って量子化器の解像度を決定し、第2の信号を決定された量子化器の解像度にしたがって量子化し、並びに前記量子化された信号に基づいて符号化された信号を発生することを特徴とする方法。
IPC (3件):
G10L 9/18 ,  G10L 9/14 ,  H03M 7/30
FI (3件):
G10L 9/18 E ,  G10L 9/14 J ,  H03M 7/30 B
引用特許:
審査官引用 (10件)
  • 特開昭60-035799
  • 特開昭57-196299
  • 特開昭62-203198
全件表示

前のページに戻る