特許
J-GLOBAL ID:200903078406047169
コンパクトな音響モデルを作成するためのバブル分割方法
発明者:
,
,
出願人/特許権者:
代理人 (10件):
前田 弘
, 小山 廣毅
, 竹内 宏
, 嶋田 高久
, 竹内 祐二
, 今江 克実
, 藤田 篤史
, 二宮 克也
, 原田 智雄
, 井関 勝守
公報種別:公開公報
出願番号(国際出願番号):特願2004-231021
公開番号(公開出願番号):特開2005-062866
出願日: 2004年08月06日
公開日(公表日): 2005年03月10日
要約:
【課題】 大語彙連続音声認識システムに使用されるコンパクトな音響モデルを構築する改良技術を提供する。【解決手段】 コンパクトな音響モデルを構築する方法は、複数の学習用話者の音声データを少なくとも1つの音声関連基準(例えば、声道長)に従って区分けする工程と、上記区分けされた学習用話者の音声データを類似した音声上の特徴を有する音声データごとにグループ化する工程と、各グループの音響バブルモデルに対してそのグループ内の音声データを用いて学習をさせる工程を含んでいる。【選択図】 図1
請求項(抜粋):
音声認識器に使用される音響モデルを構築する方法であって、
複数の学習用話者の音声データを少なくとも1つの音声関連基準に従って区分けする工程と、
上記区分けされた学習用話者の音声データを類似した音声上の特徴を有する音声データごとにグループ化する工程と、
上記各グループの音響バブルモデルに対して該グループ内の音声データを用いて学習をさせる工程とを含む方法。
IPC (3件):
G10L15/06
, G10L11/00
, G10L15/02
FI (4件):
G10L3/00 521V
, G10L3/00 521S
, G10L3/00 521T
, G10L3/00 515A
Fターム (3件):
5D015CC11
, 5D015FF04
, 5D015GG00
前のページに戻る