特許
J-GLOBAL ID:201403045487081026

音声処理装置

発明者:
出願人/特許権者:
代理人 (3件): 大林 章 ,  矢代 仁 ,  高橋 太朗
公報種別:公開公報
出願番号(国際出願番号):特願2012-248265
公開番号(公開出願番号):特開2014-095856
出願日: 2012年11月12日
公開日(公表日): 2014年05月22日
要約:
【課題】歌唱音声合成において任意の発音時点での発音内容を簡便に指定する。【解決手段】音声取得部22は、利用者が発音した音声の音声信号V1を音声入力装置14から取得する。指示取得部24は、利用者が指示した各音符の発音時点を指定する指示情報Uを指示入力装置16から取得する。音声認識部32は、音声信号V1に対する音声認識で発音内容Zを特定する。具体的には、音声認識部32は、音素の配列または各音素の開始時点が相違する複数の認識候補の各々について、当該認識候補の各音素の開始時点と指示情報Uが指定する各発音時点との時間軸上の関係に応じて当該認識候補の棄却/維持を判別し、維持された複数の認識候補から音声信号V1の発音内容を特定する。情報生成部34は、音声認識部32が特定した発音内容Zと指示情報Uが発音時点を指定する各音符との関係を示す発音情報Sを生成する。【選択図】図1
請求項(抜粋):
音声信号を取得する音声取得手段と、 利用者が指示した各音符の発音時点を指定する指示情報を取得する指示取得手段と、 音素の配列または各音素の開始時点が相違する複数の認識候補の各々について、当該認識候補の各音素の開始時点と前記指示情報が指定する各発音時点との時間軸上の関係に応じて当該認識候補の棄却/維持を判別し、維持された複数の認識候補から音声信号の発音内容を特定する音声認識手段と、 前記音声認識手段が特定した発音内容と前記指示情報が発音時点を指定する各音符との関係を示す発音情報を生成する情報生成手段と を具備する音声処理装置。
IPC (3件):
G10L 13/033 ,  G10L 13/00 ,  G10H 1/00
FI (4件):
G10L13/02 122B ,  G10L13/00 100N ,  G10L13/00 100W ,  G10H1/00 B
Fターム (1件):
5D378CC19
引用特許:
出願人引用 (9件)
全件表示

前のページに戻る