固有声に基いた最尤法を含む話者と環境適合化

発明者： , ,
出願人/特許権者：
代理人 (1件)：青山葆 (外1名)
公報種別：公開公報
出願番号（国際出願番号）：特願平11-125125
公開番号（公開出願番号）：特開平11-338491
出願日： 1999年04月30日
公開日（公表日）： 1999年12月10日
要約：

【要約】【課題】新しい話者について多くの訓練データを要することなく話者および環境適応を実現する。【解決手段】話者依存モデルのセットが比較的多数の訓練話者に関し、話者当り1モデルで訓練されるとともにモデルパラメータが所定の順序で抽出されて話者当り1個のスーパーベクトルのセットが構成される。次に、主成分解析が上記スーパーベクトルのセットに関して実行されて、固有音声空間を定義する固有ベクトルのセットが生成される。所望とあらば、ベクトルの数はデータ圧縮のため減少させることができる。その後に、新しい話者は、最尤評価に基いてスーパーベクトルが上記固有声空間内に存在するように制約することによってスーパーベクトルが構成される適合化データを与える。この新しい話者の固有空間内の結果の係数はその話者について適合化モデルが構成されるモデルパラメータの新しいセットを構成するために使用される。環境適応は、訓練データ内に環境変化を含ませることで達成できる。

請求項（抜粋）：

話者適応の実行方法は以下のステップからなる:複数の訓練話者のためのモデルのセットを与えることにより、複数の訓練話者を表現する固有空間を構成するとともに、該固有空間を定義する主成分ベクトルのセットを生成するため上記モデルのセットに関し主成分解析を実行する;適合化モデルが上記固有空間内に存在するように適合化モデルを制約するため上記主成分ベクトルのセットを用いながら、上記適合化モデルを訓練するため新しい話者からの入力音声を用いて適合化モデルを生成する。

IPC (2件)：

G10L 3/00 521 , G10L 3/00

FI (2件)：

G10L 3/00 521 S , G10L 3/00 521 T

引用特許：

審査官引用 (2件)

音声認識装置及び話者適応方法
公報種別：公開公報出願番号：特願平9-009777 出願人：株式会社東芝
音声認識装置
公報種別：公開公報出願番号：特願平9-323027 出願人：本田技研工業株式会社

前のページに戻る