特許
J-GLOBAL ID:201103009744883939
教師なし話者適応化装置、音声認識装置、教師なし話者適応化方法、音声認識方法、教師なし話者適応化プログラムを記録した記録媒体及び音声認識プログラムを記録した記録媒体
発明者:
出願人/特許権者:
代理人 (7件):
曾我 道照
, 曾我 道治
, 池谷 豊
, 古川 秀利
, 鈴木 憲七
, 長谷 正久
, 福井 宏司
公報種別:特許公報
出願番号(国際出願番号):特願平11-251603
公開番号(公開出願番号):特開2001-075588
特許番号:特許第3946912号
出願日: 1999年09月06日
公開日(公表日): 2001年03月23日
請求項(抜粋):
【請求項1】 適応学習データとして未知の発話内容の音声を使用する教師なし話者適応化装置であって、音声認識に用いる標準パタンを任意の話者に適応する話者適応標準パタンに更新する教師なし話者適応化装置において、
話者の入力音声から音声特徴量を抽出する音声特徴量抽出手段と、
前記音声特徴量抽出手段が抽出した音声特徴量と前記標準パタンとを照合することによりキーワード及び該キーワードの区間を認識して抽出し出力するキーワードスポッティング手段と、
前記キーワードの区間以外の区間については、全ての音声単位を組み合わせて最も照合スコアが高い系列を認識結果として出力する音韻タイプライタ型音声認識手段と、
前記標準パタン、前記キーワードスポッティング手段が抽出したキーワード、該キーワードとして抽出された区間の音声特徴量、及び前記音韻タイプライタ型音声認識手段の認識結果に基づいて、前記標準パタンを前記話者適応標準パタンへ更新する教師なし話者適応化手段と
を備えたことを特徴とする教師なし話者適応化装置。
IPC (3件):
G10L 15/06 ( 200 6.01)
, G10L 15/10 ( 200 6.01)
, G10L 15/14 ( 200 6.01)
FI (3件):
G10L 15/06 310 S
, G10L 15/10 200 W
, G10L 15/14 200 C
引用特許:
引用文献:
前のページに戻る