文献
J-GLOBAL ID:201802270915810075   整理番号:18A1508390

ASRのためのフラットスタート単一ステージ弁別訓練HMMベースモデル【JST・京大機械翻訳】

Flat-Start Single-Stage Discriminatively Trained HMM-Based Models for ASR
著者 (4件):
資料名:
巻: 26  号: 11  ページ: 1949-1961  発行年: 2018年 
JST資料番号: W0508B  ISSN: 2329-9290  CODEN: ITASFA  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,自動音声認識へのエンドツーエンドアプローチは,それらが資源を準備することに関して非常に速いので,かなりの注意を受けた。しかし,訓練隠れMarkovモデル(HMM)-GMMモデルとツリー構築ステップのパイプラインに依存する従来の多段階アプローチは,ほとんどのデータベースに関する最先端の結果をまだ与えている。本研究では,大語い連続音声認識のためのHMMによる格子フリー最大相互情報(LF-MMI)目的関数を用いたニューラルネットワークのフラットスタート一段訓練を研究した。著者らは,そのようなセットアップにおいて生じる異なる問題を徹底的に検討し,最先端の多段階システムのそれに匹敵する単語誤り率(WER)を達成し,一方,より速く調製することができるスタンドアロンシステムを提案した。フラットスタートコンテキスト依存(CD)モデリングを可能にするために完全なバイホンを使用することを提案し,著者らのCDモデリング手法が通常のツリーベースのCDモデリングとほぼ同等であることを実験により示した。このツリーフリーCDモデリング技術と共に,フラットスタートLF-MMIセットアップは,良く知られたデータベース上の他のエンドツーエンド法と比較して,10~25%の相対的WER低減を達成することを示した。改善はより小さいデータベースでより大きい。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  パターン認識 

前のページに戻る