ASRのためのフラットスタート単一ステージ弁別訓練HMMベースモデル【JST・京大機械翻訳】

Hadian Hossein; Sameti Hossein; Povey Daniel; Khudanpur Sanjeev

文献

J-GLOBAL ID：201802270915810075 整理番号：18A1508390

ASRのためのフラットスタート単一ステージ弁別訓練HMMベースモデル【JST・京大機械翻訳】

Flat-Start Single-Stage Discriminatively Trained HMM-Based Models for ASR

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=18A1508390&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=18A1508390&from=J-GLOBAL&jstjournalNo=W0508B") }}

著者 (4件)： , , ,
資料名：
巻： 26 号： 11 ページ： 1949-1961 発行年： 2018年
JST資料番号： W0508B ISSN： 2329-9290 CODEN： ITASFA 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

近年,自動音声認識へのエンドツーエンドアプローチは,それらが資源を準備することに関して非常に速いので,かなりの注意を受けた。しかし,訓練隠れMarkovモデル(HMM)-GMMモデルとツリー構築ステップのパイプラインに依存する従来の多段階アプローチは,ほとんどのデータベースに関する最先端の結果をまだ与えている。本研究では,大語い連続音声認識のためのHMMによる格子フリー最大相互情報(LF-MMI)目的関数を用いたニューラルネットワークのフラットスタート一段訓練を研究した。著者らは,そのようなセットアップにおいて生じる異なる問題を徹底的に検討し,最先端の多段階システムのそれに匹敵する単語誤り率(WER)を達成し,一方,より速く調製することができるスタンドアロンシステムを提案した。フラットスタートコンテキスト依存(CD)モデリングを可能にするために完全なバイホンを使用することを提案し,著者らのCDモデリング手法が通常のツリーベースのCDモデリングとほぼ同等であることを実験により示した。このツリーフリーCDモデリング技術と共に,フラットスタートLF-MMIセットアップは,良く知られたデータベース上の他のエンドツーエンド法と比較して,10~25%の相対的WER低減を達成することを示した。改善はより小さいデータベースでより大きい。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , , ,
, , , , 【Automatic Indexing@JST】

音声処理 , パターン認識

, , , , , ,

前のページに戻る