特許
J-GLOBAL ID:201103083501162333

音声認識装置及び音声認識方法、音声認識システム、並びに、プログラム記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 青山 葆 ,  山崎 宏
公報種別:特許公報
出願番号(国際出願番号):特願2000-127390
公開番号(公開出願番号):特開2001-312295
特許番号:特許第3689616号
出願日: 2000年04月27日
公開日(公表日): 2001年11月09日
請求項(抜粋):
【請求項1】 第1話者の音声を第2話者の音声に変換して話者正規化する話者正規化機能付きの音声認識装置であって、 上記第1話者が発声した第1音声から第1スペクトル包絡を抽出する一方、第2話者が発声した第2音声から第2スペクトル包絡を抽出するスペクトル包絡抽出手段と、 上記抽出された第1スペクトル包絡および第2スペクトル包絡を、音声単位のラベルを付与して格納する第1メモリ手段と、 同一ラベルに関して、上記第1メモリに格納された上記第1スペクトル包絡と第2スペクトル包絡とに対して動的計画法を用いた非線形な周波数伸縮マッチングを行って、両スペクトル包絡の周波数軸の対応付けを表わす周波数ワーピング関数を求める非線形周波数軸スペクトルマッチング手段と、 上記周波数ワーピング関数を、音声単位のラベルを付与して格納する第2メモリ手段と、 上記スペクトル包絡抽出手段によって抽出された認識対象の第1スペクトル包絡が入力されて、この認識対象第1スペクトル包絡の音声単位と同じ音声単位名の周波数ワーピング関数を上記第2メモリから読み出し、この読み出された周波数ワーピング関数に基づいて、上記認識対象第1スペクトル包絡を第2話者に関するスペクトル包絡に変換するスペクトル包絡変換手段と、 上記変換された正規化済みスペクトル包絡に基づいて入力音声を認識する音声認識手段と、 上記第2メモリ手段に格納された周波数ワーピング関数を上記ラベルに基づいて音素,類似音素,有声音区間/無声音区間および話者毎にグループ化し、各グループに属する周波数ワーピング関数の平均値を算出し、得られた平均周波数ワーピング関数を各グループ名のラベルを付与して上記第2メモリ手段に格納させる平均化手段を備えて、 上記スペクトル包絡変換手段は、上記第1メモリに格納された上記認識対象第1スペクトル包絡の音素と同じ音素に関する上記第1話者のデータの量に応じて決定されたグループの平均周波数ワーピング関数を、上記周波数ワーピング関数として用いるようになっていることを特徴とする音声認識装置。
IPC (4件):
G10L 15/20 ,  G10L 15/02 ,  G10L 15/12 ,  G10L 21/02
FI (3件):
G10L 3/02 301 A ,  G10L 3/00 533 Z ,  G10L 7/08 A
引用特許:
審査官引用 (2件)

前のページに戻る