特許
J-GLOBAL ID:200903020540175078
音声処理装置、およびプログラム
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
谷川 英和
公報種別:公開公報
出願番号(国際出願番号):特願2005-241264
公開番号(公開出願番号):特開2007-057692
出願日: 2005年08月23日
公開日(公表日): 2007年03月08日
要約:
【課題】従来の音声処理装置においては、音声の話者である評価対象者の話者特性に応じた音声処理(歌声評定など)が行えず、その結果、精度の高い音声処理ができない、という課題があった。【解決手段】格納している第一サンプリング周波数で、受け付けた音声をサンプリングし、第一音声データを取得するサンプリング部と、前記音声受付部が受け付けた音声の話者である評価対象者のフォルマント周波数である評価対象者フォルマント周波数を格納しており、第二サンプリング周波数「前記第一サンプリング周波数/(教師データのフォルマント周波数/評価対象者フォルマント周波数)」で、前記受け付けた音声に対して、サンプリング処理を行い、第二音声データを得る声道長正規化処理部と、前記第二音声データを処理する音声処理部を具備する音声処理装置により、話者特性に応じた音声処理ができる。【選択図】図1
請求項(抜粋):
比較される対象の音声に関するデータであり、1以上の音韻毎のデータである教師データを1以上格納している教師データ格納部と、
音声を受け付ける音声受付部と、
第一サンプリング周波数を格納している第一サンプリング周波数格納部と、
前記第一サンプリング周波数で、前記音声受付部が受け付けた音声をサンプリングし、第一音声データを取得するサンプリング部と、
前記教師データのフォルマント周波数である教師データフォルマント周波数を格納している教師データフォルマント周波数格納部と、
前記音声受付部が受け付けた音声の話者である評価対象者のフォルマント周波数である評価対象者フォルマント周波数を格納している評価対象者フォルマント周波数格納部と、
第二サンプリング周波数「前記第一サンプリング周波数/(教師データフォルマント周波数/評価対象者フォルマント周波数)」で、前記音声受付部が受け付けた音声に対して、サンプリング処理を行い、第二音声データを得る声道長正規化処理部と、
前記第二音声データを処理する音声処理部を具備する音声処理装置。
IPC (4件):
G10L 11/00
, G10L 15/20
, G10L 21/02
, G10L 15/00
FI (6件):
G10L11/00 407
, G10L11/00 101D
, G10L11/00 402A
, G10L11/00 402L
, G10L3/02 301A
, G10L3/00 551E
Fターム (1件):
引用特許:
出願人引用 (3件)
審査官引用 (9件)
全件表示
前のページに戻る