特許
J-GLOBAL ID:200903050630116786
音声処理装置と方法並びにプログラム
発明者:
出願人/特許権者:
代理人 (1件):
加藤 朝道
公報種別:公開公報
出願番号(国際出願番号):特願2004-003893
公開番号(公開出願番号):特開2005-196020
出願日: 2004年01月09日
公開日(公表日): 2005年07月21日
要約:
【課題】 特定の音響環境向けに構成された音声認識装置を異なる音響環境で用いる場合、該音響環境に適した音響モデルを作成するために、新しい音響環境の音声を多く集めることを要しなくする装置及び方法並びにプログラムの提供。【解決手段】 一の音響環境で収録された既存の学習用音声データを記憶する既存学習データ記憶部100と、前記既存の学習用音声データと同じ音響環境の音声データ、及び該音声データと同時に録音された他の音響環境の音声データの対を記憶する同時録音音声データ対記憶部110と、同時録音音声データ対記憶部110に記憶されている音声データ対から2つの音響環境間の写像を求める写像生成部120と、前記既存の学習用音声データを、前記写像生成部120で得られた写像を用いて変換し、前記他の音響環境向けの学習用音声データを生成する新音響環境学習データ生成部130と、新音響環境学習データ生成部130で得られた学習用音声データを記憶する新音響環境学習データ記憶部140とを備える。【選択図】 図1
請求項(抜粋):
一の音響環境と、前記一の音響環境と異なる他の音響環境とで同時に録音された音声データ対を用いて、2つの音響環境間の写像を求める手段と、
前記一の音響環境向けの音声データ又は音響モデルを、前記写像を用いて前記他の音響環境向けに変換する手段と、
を備え、前記一の音響環境向けに構成された音声認識装置を、前記他の音響環境に適した音声認識装置に再構成可能としてなる、ことを特徴とする音声処理装置。
IPC (1件):
FI (2件):
G10L3/00 521T
, G10L3/00 521C
Fターム (2件):
引用特許: