特許
J-GLOBAL ID:200903084233796640
音声波形の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、音声信号の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、ならびに擬似音節核抽出装置およびプログラム
発明者:
,
出願人/特許権者:
,
代理人 (1件):
清水 敏
公報種別:公開公報
出願番号(国際出願番号):特願2002-141390
公開番号(公開出願番号):特開2003-330478
出願日: 2002年05月16日
公開日(公表日): 2003年11月19日
要約:
【要約】【課題】 音声波形の特徴を高い信頼性で示す部分を決定できるようにする。【解決手段】 この装置は、データから音声波形のうちの所定周波数領域のエネルギーの時間軸上の分布を算出し、当該分布および音声波形のピッチに基づいて、音声波形の各節のうち、話者によって安定して発生されている領域を抽出する音響・韻律分析部92と、データから音声波形のスペクトルの時間軸上の分布を算出し、その時間軸上の分布に基づいて、音声波形のうち、その変化が話者により良好に制御されている領域を推定するケプストラム分析部94と、話者によって安定して発生されている領域として抽出され、かつ話者によってその変化が良好に制御されていると推定された領域を音声波形の高信頼性部分として決定する擬似音節中心の抽出部96とを含む。
請求項(抜粋):
音声波形のデータに基づいて、前記音声波形の特徴を高い信頼性で示す部分を決定するための装置であって、前記データから前記音声波形のうちの所定周波数領域のエネルギーの時間軸上の分布を算出し、当該分布および前記音声波形のピッチに基づいて、前記音声波形の各節のうち、前記音声波形の発生源によって安定して発生されている領域を抽出するための抽出手段と、前記データから前記音声波形のスペクトルの時間軸上の分布を算出し、当該スペクトルの時間軸上の分布に基づいて、前記音声波形のうち、その変化が前記発生源により良好に制御されている領域を推定するための推定手段と、前記推定手段の出力と、前記発生源によって安定して発生されている領域として前記抽出手段により抽出され、かつ前記発生源によってその変化が良好に制御されていると前記推定手段によって推定された領域を前記音声波形の高信頼性部分として決定するための手段とを含む、音声波形の特徴を高い信頼性で示す部分を決定するための装置。
IPC (4件):
G10L 11/00
, G10L 11/06
, G10L 15/02
, G10L 15/10
FI (3件):
G10L 9/14 A
, G10L 3/00 515 D
, G10L 3/00 531 N
Fターム (1件):
前のページに戻る