特許
J-GLOBAL ID:200903025188250562

音声信号変換装置

発明者:
出願人/特許権者:
代理人 (3件): 森 哲也 ,  内藤 嘉昭 ,  崔 秀▲てつ▼
公報種別:公開公報
出願番号(国際出願番号):特願2006-197173
公開番号(公開出願番号):特開2008-026489
出願日: 2006年07月19日
公開日(公表日): 2008年02月07日
要約:
【課題】話者変動、様式変動および環境変動が複合的に影響する場合に、特徴パラメータ系列を精度よく変換するのに好適な音声信号変換装置を提供する。【解決手段】入力音声信号から特徴パラメータ系列を抽出し、入力音声信号の特徴パラメータ系列を第1基準話者16aの音声信号の特徴パラメータ系列に変換し、変換した特徴パラメータ系列を第1基準様式16bの音声信号の特徴パラメータ系列に変換し、変換した特徴パラメータ系列を第2基準様式16cの音声信号の特徴パラメータ系列に変換し、変換した特徴パラメータ系列を第2基準話者16dの音声信号の特徴パラメータ系列に変換し、変換した特徴パラメータ系列を出力音声信号の特徴パラメータ系列に変換し、変換した特徴パラメータ系列から出力音声信号を生成する。【選択図】 図2
請求項(抜粋):
入力音声信号を目標の出力音声信号に変換する音声信号変換装置であって、 前記入力音声信号から所定次元数以上の高次元の特徴パラメータ系列を抽出する特徴パラメータ系列抽出手段と、 複数話者から取得した音声データを話者属性、様式属性および環境属性の3つの属性に基づいてグループ分けし、当該各グループに属する音声データに基づいて所定次元数以上の高次元の特徴パラメータ系列を有する高次元音響モデルを生成し、当該高次元音響モデル相互間の数学的距離関係を保持しながら前記高次元音響モデルから変換した前記高次元の次元数未満の音響モデル対応低次元ベクトルから構成される音響モデルマップを、前記高次元音響モデルとともに記憶する音響モデルマップ記憶手段と、 話者属性間の変動、様式属性間の変動および環境属性間の変動のうち少なくとも2つの組み合わせに応じて、前記特徴パラメータ系列抽出手段で抽出した特徴パラメータ系列を前記出力音声信号の特徴パラメータ系列に変換する特徴パラメータ系列変換手段と、 前記特徴パラメータ系列変換手段で変換した特徴パラメータ系列から前記出力音声信号を生成する音声信号生成手段とを備え、 前記音響モデルマップは、環境属性が同一である音響モデル対応低次元ベクトルの分布領域が、様式属性の異なる複数の音響モデル対応低次元ベクトルの分布領域を包含する関係と、前記様式属性の異なる複数の音響モデル対応低次元ベクトルの分布領域それぞれが、話者属性の異なる複数の音響モデル対応低次元ベクトルの分布領域を包含する関係とを有することを特徴とする音声信号変換装置。
IPC (2件):
G10L 15/06 ,  G10L 21/04
FI (5件):
G10L15/06 310T ,  G10L15/06 310S ,  G10L15/06 310Z ,  G10L21/04 120Z ,  G10L21/04 300
Fターム (1件):
5D015GG00
引用特許:
審査官引用 (2件)
引用文献:
前のページに戻る