特許
J-GLOBAL ID:201703001970878453

音声信号のタイムワープ処理改良変換符号化

発明者:
出願人/特許権者:
代理人 (1件): 岡田 全啓
公報種別:特許公報
出願番号(国際出願番号):特願2013-106030
公開番号(公開出願番号):特開2013-210654
特許番号:特許第6125324号
出願日: 2013年05月20日
公開日(公表日): 2013年10月10日
請求項(抜粋):
【請求項1】 音声入力信号(100)を受信し、さらにデコーダに送信されるビットストリームを生成する音声エンコーダであって、 ワープ・パラメータ・シーケンスを推定するワープ・パラメータ・エクストラクタ(101)と、 前記ワープ・パラメータ・シーケンスを受信し、さらに前記音声入力信号(100)のタイムワープ処理スペクトル表現を導き出すワープ・トランスフォーマ(102)と、 前記音声入力信号(100)を受信する知覚モデル・カルキュレータ(103)と、 送信時の前記ビットストリーム内におけるサイズを小さくするために、前記ワープ・パラメータ・シーケンスを符号化するワープ・コーダ(104)と、 前記音声入力信号の符号化されたタイムワープ処理スペクトル表現を得るために、量子化のための第1および第2のタイムワープ処理スペクトル表現を受信するエンコーダ(105)であって、前記エンコーダ(105)は前記知覚モデル・カルキュレータ(103)によって制御される、エンコーダと、 前記符号化されたワープ・パラメータ・シーケンスおよび前記音声入力信号の前記符号化されたタイムワープ処理スペクトル表現を受信しさらに多重化するマルチプレクサ(106)とを含み、 前記音声入力信号の前記符号化されたタイムワープ処理スペクトル表現は、第1フレームと、前記第1フレームに続く第2フレームと、前記第2フレームに続く第3フレームとを有する前記音声入力信号の表現を含み、前記音声入力信号は、時間領域であり、 前記ワープ・パラメータ・エクストラクタ(101)は、前記第1フレームおよび前記第2フレームに対する第1ワープ情報を推定し、さらに前記第2フレームおよび前記第3フレームに対する第2ワープ情報を推定するためのワープ推定器を含み、前記第1ワープ情報は前記音声入力信号の前記第1フレームおよび前記第2フレームの時間軸の変更を行うためのタイムワーピングの関数を表し、さらに前記第2ワープ情報は前記音声入力信号の前記第2フレームおよび前記第3フレームの時間軸の変更を行うためのタイムワーピングの関数を表し、 前記ワープ・トランスフォーマ(102)は、前記音声入力信号の前記第1フレームおよび前記第2フレーム、ならびに前記第1ワープ情報を用いて前記第1フレームおよび前記第2フレームに対する前記音声入力信号(100)の前記第1のタイムワープ処理スペクトル表現を導き出し、さらに前記音声入力信号の前記第2フレームおよび前記第3フレーム、ならびに前記第2ワープ情報を用いて前記第2フレームおよび前記第3フレームに対する前記音声入力信号(100)の前記第2のタイムワープ処理スペクトル表現を導き出すスペクトル・アナライザを含み、さらに 前記マルチプレクサ(106)は、前記第1および前記第2のタイムワープ処理スペクトル表現を含む前記音声入力信号の前記表現を出力する出力インタフェースを含む、音声エンコーダ。
IPC (2件):
G10L 19/02 ( 201 3.01) ,  G10L 19/035 ( 201 3.01)
FI (2件):
G10L 19/02 150 ,  G10L 19/035 Z
引用特許:
出願人引用 (1件)
  • 音声信号送信システム
    公報種別:公表公報   出願番号:特願2001-500258   出願人:コーニンクレッカフィリップスエレクトロニクスエヌヴィ
審査官引用 (1件)
  • 音声信号送信システム
    公報種別:公表公報   出願番号:特願2001-500258   出願人:コーニンクレッカフィリップスエレクトロニクスエヌヴィ

前のページに戻る