特許
J-GLOBAL ID:200903090128091720

音声認識用情報作成方法、音響モデル作成方法、音声認識方法、音声合成用情報作成方法、音声合成方法及びそれらの装置、並びにプログラム及びそのプログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 草野 卓 ,  稲垣 稔
公報種別:公開公報
出願番号(国際出願番号):特願2002-162815
公開番号(公開出願番号):特開2004-012584
出願日: 2002年06月04日
公開日(公表日): 2004年01月15日
要約:
【課題】HMMを用いた音声合成系に、STRAIGHT合成系を導入し、音声認識におけるパラメータとテキストからの音声合成におけるパラメータとで同一のものを用い、高品質で簡単なシステム構成を実現する。【解決手段】HMMを用いた音声合成系のパラメータとして入力音声を短時間フーリエ変換し、基本周波数の影響を除去してSTRAIGHTスペクトルを生成し、STRAIGHTスペクトルの対数変換、周波数伸縮離散コサイン変換によりSTRAIGHTメルケプストラムに変換する。STRAIGHTメルケプストラムのパラメータとその学習テキストに基づいてHMMを学習し、このHMMを用いて音声認識を行い、音声合成時には、学習されたHMMを用いてテキストから音声を合成する。【選択図】図3
請求項(抜粋):
音声認識で用いられる音声認識用情報を作成する音声認識用情報作成方法であって、 入力音声をSTRAIGHTスペクトルに分析するステップと、 STRAIGHTスペクトルを対数変換し、離散コサイン変換してSTRAIGHTメルケプストラムを作成するステップと、を備えたことを特徴とする音声認識用情報作成方法。
IPC (5件):
G10L15/02 ,  G10L11/00 ,  G10L11/06 ,  G10L13/00 ,  G10L15/14
FI (6件):
G10L9/10 301A ,  G10L3/00 535Z ,  G10L9/16 ,  G10L9/16 301A ,  G10L3/00 515D ,  G10L9/00 L
Fターム (3件):
5D015CC11 ,  5D015FF00 ,  5D015HH23
引用文献:
前のページに戻る