特許
J-GLOBAL ID:200903021094927512
音声の認識合成符号化/復号化方法及び音声符号化/復号化システム
発明者:
,
出願人/特許権者:
代理人 (1件):
鈴江 武彦 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-064933
公開番号(公開出願番号):特開平10-260692
出願日: 1997年03月18日
公開日(公表日): 1998年09月29日
要約:
【要約】【課題】1kbps以下の極低レートで音声信号を符号化するために、不完全な音声認識技術でも適用でき、かつ話者の感情など非言語的な情報も伝送することができる認識合成に基づいた音声符号化/復号化システムを提供する。【解決手段】送信側において入力音声データをピッチ検出部101、音素認識部102および継続時間長検出部103に入力して、ピッチ周期の検出、音節の認識および音素の継続時間長の検出を行い、これらピッチ周期、音節および継続時間長の情報を符号化回路104,105,106により符号化した後、符号列をマルチプレクサ107を経て通信路に伝送し、受信側においてはデマルチプレクサ110で符号列からピッチ周期、音節および継続時間長の情報を復号化し、これらの復号化された情報に基づいて合成器114で元の音声信号を合成する。
請求項(抜粋):
入力音声信号から文字情報を認識するとともに、該入力音声信号から韻律情報を検出して、これら文字情報および韻律情報を符号化データとして伝送または蓄積し、伝送または蓄積された符号化データから前記文字情報および韻律情報を復号し、復号された文字情報および韻律情報に基づいて音声信号を合成することを特徴とする音声の認識合成符号化/復号化方法。
IPC (3件):
G10L 3/00
, G10L 3/00 535
, G10L 3/00 551
FI (4件):
G10L 3/00 R
, G10L 3/00 H
, G10L 3/00 535
, G10L 3/00 551 A
引用特許:
審査官引用 (3件)
-
特開昭61-296396
-
特開平4-316100
-
文章読み上げ装置
公報種別:公開公報
出願番号:特願平4-121560
出願人:エヌ・ティ・ティ・データ通信株式会社
前のページに戻る