特許
J-GLOBAL ID:200903056853724786
音響モデルの作成方法
発明者:
,
出願人/特許権者:
,
代理人 (4件):
西出 眞吾
, 前田 均
, 大倉 宏一郎
, 佐藤 美樹
公報種別:公開公報
出願番号(国際出願番号):特願2006-028213
公開番号(公開出願番号):特開2007-206603
出願日: 2006年02月06日
公開日(公表日): 2007年08月16日
要約:
【課題】乗車などに起因する発話歪があっても音声を性能良く認識できる音響モデルを提供する。【解決手段】音響的雑音が実質的にない環境において所定の音声を収録して無歪音声コーパス1を作成するステップと、ステップで作成した無歪音声コーパスの音声を、移動体の移動速度に対応した発話に変形する発話変換フィルタ手段2を用いて補正し、移動環境音声コーパス3を作成するステップと、ステップで作成された移動環境音声コーパス3を学習データとして学習して音響モデル4を作成するステップと、を有する。【選択図】 図1
請求項(抜粋):
移動体内で利用されることがある音声認識装置に用いられ、音声信号をラベル信号に変換するための音響モデルの作成方法であって、
音響的雑音が実質的にない環境において所定の音声を収録して無歪音声コーパスを作成するステップと、
前記ステップで作成した無歪音声コーパスの音声を、前記移動体の移動速度に対応した発話に変形する発話変換フィルタ手段を用いて補正し、移動環境音声コーパスを作成するステップと、
前記ステップで作成された移動環境音声コーパスを学習データとして学習して音響モデルを作成するステップと、を有することを特徴とする音響モデルの作成方法。
IPC (3件):
G10L 15/06
, G10L 15/00
, G10L 15/20
FI (6件):
G10L15/06 300C
, G10L15/06 400V
, G10L15/06 500L
, G10L15/06 310T
, G10L15/00 200J
, G10L15/20 360Z
Fターム (1件):
前のページに戻る