特許
J-GLOBAL ID:200903027709082095

話速変換方法およびその装置

発明者:
出願人/特許権者:
代理人 (1件): 三好 秀和 (外8名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-061015
公開番号(公開出願番号):特開平10-257596
出願日: 1997年03月14日
公開日(公表日): 1998年09月25日
要約:
【要約】【課題】 受聴者の操作に応じて、出力音声の話速を瞬時に追従させ、これによって受聴者側の使い勝手を大幅に向上させる。【解決手段】 入力された音声データに対し、分析処理部3は属性に基づく分析処理を行なう。ブロックデータ分割部4は分析処理部3の分析結果に応じて、音声データを所定の時間幅を有するブロック単位に分割してブロック音声データを生成してブロックデータ蓄積部5に蓄積する。接続データ生成部6は各ブロック音声データを使用して接続データを生成し、これを接続データ蓄積部7に蓄積する。一方、設定された音声スピードに対応する条件に基づき、接続順序生成部8は各ブロック音声データと、各接続データとの接続順序を生成する。この接続順序に基づき、音声データ接続部9はブロックデータ蓄積部5に蓄積されているブロック音声データと、接続データ蓄積部7に蓄積されている接続データとを順次、接続して一連の音声データを生成する。
請求項(抜粋):
入力された音声データに対して、属性に基づく分析処理を施し、この分析処理で得られた情報に基づいて前記音声データを所定の時間幅を有するブロック単位に分割し、これをブロック音声データとして蓄積するとともに、前記音声データの時間的な伸長を実現するために、隣り合うブロック音声データ間において置換または挿入すべき接続データを各ブロック毎に生成して蓄積しながら、受聴者の操作に応じた任意の音声スピードに対応する出力音声データを生成するためのブロック接続順序を生成し、この接続順序にしたがって、既にブロック単位に分割されて蓄積されているブロック音声データおよび接続データを順次、接続して出力音声データを生成することを特徴とする話速変換方法。
IPC (2件):
H04R 25/00 ,  G10L 3/02
FI (2件):
H04R 25/00 M ,  G10L 3/02 A

前のページに戻る