特許
J-GLOBAL ID:200903009748327919

音声処理用適応モデル作成方法

発明者:
出願人/特許権者:
代理人 (1件): 岩橋 文雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2002-000337
公開番号(公開出願番号):特開2003-202891
出願日: 2002年01月07日
公開日(公表日): 2003年07月18日
要約:
【要約】【課題】 それぞれの利用者、利用環境に適応化した適応モデルの作成を行う利用者の負担が少ない音声認識用適応モデル作成方法を提供すること。【解決手段】 第1の音声データを用いて十分統計量と、十分統計量を選択する選択モデルを作成する十分統計量・選択モデル作成手段と、十分統計量・選択モデル蓄積手段と、利用者の音声データである第2の音声データを用いて複数の第Kの特徴量データを作成する複数データ作成手段と、十分統計量の中から選択モデルを用いて第Kの特徴量データに音響的に近い十分統計量を選択して、選択した十分統計量を用いて第Kの適応モデル候補を作成する第Kの適応モデル作成手段と、第Kの適応モデル候補を蓄積する適応モデル候補蓄積手段と、第Kの適応モデル候補の中から、利用者の音声データである第2の音声データに音響的に近い適応モデル候補を選択する適応モデル選択手段とを備える。
請求項(抜粋):
第1の音声データを用いて十分統計量と前記十分統計量を選択する選択モデルを作成する十分統計量・選択モデル作成手段と、前記十分統計量・選択モデル作成手段が作成した前記十分統計量と前記選択モデルを蓄積する十分統計量・選択モデル蓄積手段と、利用者の音声データである第2の音声データを用いて複数の第Kの特徴量データ(K=1,...,N)を作成する複数データ作成手段と、前記十分統計量・選択モデル蓄積手段が蓄積した前記十分統計量の中から、前記十分統計量・選択モデル蓄積手段が蓄積した前記選択モデルを用いて、前記複数データ作成手段が作成した前記第Kの特徴量データ(K=1,...,N)に音響的に近い十分統計量を選択して、前記選択した十分統計量を用いて第Kの適応モデル候補(K=1,...,N)を作成する第Kの適応モデル作成手段(K=1,...,N)と、前記複数の第Kの適応モデル作成手段(K=1,...,N)が作成した前記の第Kの適応モデル候補(K=1,...,N)を蓄積する適応モデル候補蓄積手段と、前記適応モデル候補蓄積手段が蓄積した前記複数の第Kの適応モデル候補(K=1,...,N)の中から、利用者の音声データである第2の音声データに音響的に近い適応モデル候補を選択する適応モデル選択手段とを備えることを特徴とする音声処理用適応モデル作成方法。
IPC (2件):
G10L 15/06 ,  G10L 15/14
FI (3件):
G10L 3/00 521 S ,  G10L 3/00 535 C ,  G10L 3/00 521 V
Fターム (5件):
5D015AA02 ,  5D015BB02 ,  5D015CC01 ,  5D015CC11 ,  5D015HH11
引用特許:
審査官引用 (3件)
引用文献:
前のページに戻る