特許
J-GLOBAL ID:201503043051849357

発声特定装置、プログラム

発明者:
出願人/特許権者:
代理人 (1件): 名古屋国際特許業務法人
公報種別:特許公報
出願番号(国際出願番号):特願2012-054615
公開番号(公開出願番号):特開2013-190473
特許番号:特許第5678912号
出願日: 2012年03月12日
公開日(公表日): 2013年09月26日
請求項(抜粋):
【請求項1】 発声すべき内容の文字列、並びに前記文字列を構成する文字の各々の基準発声開始タイミング、及び基準発声終了タイミングを表す発声内容情報を取得する発声情報取得手段と、 前記発声情報取得手段によって取得された発声内容情報に基づいて、前記文字列を構成する音節の各々について発声すべき区間である模範発声区間を特定する模範区間特定手段と、 前記模範区間特定手段で特定された前記模範発声区間の各々に対応する音節ほど大きな値となるように、前記音節の各々、かつ当該音節に対応する区間である重み付与区間ごとに重みを設定する重み設定手段と、 前記発声情報取得手段によって取得された発声内容情報によって表される文字列について発声された音声波形を表す音声データを取得する音声データ取得手段と、 前記音声データ取得手段で取得された音声データに対し、当該音声データにおける時間軸に沿って連続するように複数の単位区間を設定する区間設定手段と、 前記区間設定手段で設定された音声データの1つの単位区間における特徴量に対して、音素ごとの特徴量を表すモデルとして予め用意された音響モデルの各々を照合すると共に、前記重み設定手段で設定され、かつ当該単位区間に対応する前記重み付与区間での重みを付与した発声尤度それぞれを導出し、前記発声尤度が最も大きな結果となる音響モデルに対応する音素を、当該単位区間において発声された音素である発声音素として特定する内容特定処理を、当該音声データにおける時間軸に沿って前記単位区間ごとに順次実行する音素特定手段と、 前記音素特定手段で順次特定される発声音素に基づいて、前記音声データにおいて発声された音節である発声音節を特定するごとに、前記発声音節が時間軸に沿って切り替わったタイミングである発声切替タイミングを特定するタイミング特定手段と、 前記タイミング特定手段で特定した発声切替タイミングの直前の前記発声音節を推定完了音節とし、当該発声切替タイミングの直後の発声音素が構成する音節を推定中音節とし、時間軸に沿って前記模範発声区間が切り替わるタイミングである模範切替タイミングと前記発声切替タイミングとのズレが予め規定された許容値以上である場合、時間軸に沿った前記推定中音節以降の音節に対応する前記単位区間について、前記文字列によって表され、かつ当該単位区間に対応する音節を構成する音素が前記音素特定手段にて前記発声音素として特定されるように、前記重み設定手段で規定され前記推定中音節に対応する前記重み付与区間以降における重み付与区間を変更する重み変更手段と を備えることを特徴とする発声特定装置。
IPC (3件):
G10L 15/04 ( 201 3.01) ,  G10L 25/51 ( 201 3.01) ,  G10K 15/04 ( 200 6.01)
FI (4件):
G10L 15/04 200 ,  G10L 25/51 100 ,  G10K 15/04 302 D ,  G10L 15/04 300 Z
引用特許:
出願人引用 (8件)
全件表示
引用文献:
出願人引用 (1件)

前のページに戻る