特許
J-GLOBAL ID:201603011135588434

テキストデータと読み上げ音声データとの同期処理装置および同期処理プログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人綿貫国際特許・商標事務所
公報種別:公開公報
出願番号(国際出願番号):特願2014-134915
公開番号(公開出願番号):特開2016-012099
出願日: 2014年06月30日
公開日(公表日): 2016年01月21日
要約:
【課題】テキストデータとこれを音読した読み上げ音声データの同期処理を行うこと。【解決手段】記憶部20に記憶させたテキストデータTDおよびこれを音読した読み上げ音声データSDをフレーズ毎に分割して音素変換し、分割したテキストデータと読み上げ音声データにおけるテキストデータ音素変換累計値TNと読み上げ音声データ音素変換累計値SNを算出し、テキストデータ音素変換累計値TNに対して、読み上げ音声データ音素変換累計値SNの最近似値を抽出して、読み上げ音声データ音素変換累計値SNを、分割テキストデータTDにおけるフレーズ再生順序を指定する識別子に紐付けしたフレーズ対応データFDを作成し、フレーズ対応データFDに基づいて、テキストデータTDと読み上げ音声データSDをフレーズ毎に同期出力させるテキストデータと読み上げ音声データとの同期処理装置10である。【選択図】図1
請求項(抜粋):
複数のフレーズからなるテキストデータと該テキストデータの読み上げ音声データのそれぞれを記憶可能な記憶部と、 前記記憶部に記憶されている前記テキストデータを前記フレーズ毎に分割し、分割順を示す識別子と対応させた分割テキストデータを前記記憶部に記憶させるテキストデータ分割部と、 前記分割テキストデータを前記フレーズ毎に音素変換処理をして得たテキストデータ音素変換値を、前記フレーズ毎に対応させた状態で前記記憶部に記憶させるテキストデータ音素変換部と、 前記分割テキストデータの前記フレーズ毎における前記テキストデータ音素変換値の累計値を算出し、該算出して得たテキストデータ音素変換累計値を、前記分割テキストデータの前記フレーズ毎に対応させた状態で前記記憶部に記憶させるテキストデータ音素変換累計値算出部と、 前記読み上げ音声データから、予め設定された無音区間抽出判断データに基づいて無音部分を抽出し、該抽出した無音部分において前記読み上げ音声データを分割し、分割順を示す識別子と対応させた分割読み上げ音声データを前記記憶部に記憶させる読み上げ音声データ分割部と、 前記分割読み上げ音声データの分割範囲毎に音素変換処理をして得た読み上げ音声データ音素変換値を、前記分割読み上げ音声データの分割範囲毎に対応させた状態で前記記憶部に記憶させる読み上げ音声データ音素変換部と、 前記分割読み上げ音声データの分割範囲毎における前記読み上げ音声データ音素変換値の累計値を算出し、該算出した読み上げ音声データ音素変換値の累計値を、前記分割読み上げ音声データの分割範囲毎に対応させた状態で前記記憶部に記憶させる読み上げ音声データ音素変換累計値算出部と、 前記分割テキストデータにおいて前記フレーズ毎に対応させた前記テキストデータ音素変換累計値に対して、前記読み上げ音声データ音素変換累計値の最近似値を抽出し、前記分割テキストデータ内における前記フレーズ毎に対応する前記読み上げ音声データ音素変換累計値を、前記分割テキストデータにおける前記フレーズの再生順序を指定する識別子に紐付けしたフレーズ対応データを作成するフレーズ対応データ作成部と、 前記フレーズ対応データに基づいて、対応する前記テキストデータのフレーズと前記分割読み上げ音声データをそれぞれ対応させた状態で出力する出力部と、 を有していることを特徴とするテキストデータと読み上げ音声データとの同期処理装置。
IPC (3件):
G10L 19/00 ,  G10L 15/04 ,  G10L 15/10
FI (3件):
G10L19/00 312F ,  G10L15/04 300A ,  G10L15/10 400M

前のページに戻る