特許
J-GLOBAL ID:200903099691013750

話速変換方法および装置および話速変換プログラムを格納した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 志賀 正武
公報種別:公開公報
出願番号(国際出願番号):特願平11-065512
公開番号(公開出願番号):特開2000-259200
出願日: 1999年03月11日
公開日(公表日): 2000年09月22日
要約:
【要約】【課題】原音の音質を保ったまま簡単な方法で話速変換を行なうことができる話速変換装置を提供する。【解決手段】音声波形の基本周期の波形(ピッチ区間波形)をその音声波形に対して挿入・削除することにより、音声波形の定常的な区間のみを伸長・短縮して録音音声の話速を変換する話速変換装置であって、パラメータとして波形類似度下限値βおよび話速変換率αを与えるための閾値入力部3および話速変換率入力部4と、入力音声波形を先頭から順次短いフレーム区間で切りだすフレーム切りだし部5と、切りだされたフレーム区間の波形の自己相関関数を計算する自己相関関数計算部6と、自己相関関数における極大値y(T)が波形類似度下限値βよりも大きい場合に当該フレーム区間の波形が定常的であるとみなし、当該フレーム区間波形に対して極大値を与える周期Tを基本周期とするピッチ区間波形の挿入・削除を行なう波形挿入/削除部8とを備える。
請求項(抜粋):
音声波形の基本周期の波形(以下、ピッチ区間波形と呼ぶ)を適宜挿入・削除することにより、音声波形の定常的な区間のみを伸長・短縮して録音音声の話速を変換する話速変換方法において、パラメータとして波形類似度下限値を設定し、入力音声波形を先頭から順次短い区間で切りだし(以下、切り出した波形をフレーム区間波形と呼ぶ)、当該フレーム区間波形の波形類似度を計算し、前記波形類似度が、前記パラメータとして与えた波形類似度下限値よりも大きい場合に当該フレーム区間波形は定常的であるとみなし、当該フレーム区間波形に対してピッチ区間波形の挿入・削除を行なうことを特徴とする話速変換方法。
IPC (3件):
G10L 21/04 ,  G10L 13/08 ,  G10L 11/04
FI (3件):
G10L 3/02 D ,  G10L 3/00 H ,  G10L 9/08 B
Fターム (1件):
5D045AA08
引用特許:
審査官引用 (3件)

前のページに戻る