プレプリント
J-GLOBAL ID:202202202783844270   整理番号:22P0148267

誤音検出のための効果的なエンドツーエンドモデリングアプローチ【JST・京大機械翻訳】

An Effective End-to-End Modeling Approach for Mispronunciation Detection
著者 (4件):
資料名:
発行年: 2020年05月17日  プレプリントサーバーでの情報更新日: 2020年05月17日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
最近,エンドツーエンド(E2E)自動音声認識(ASR)システムは,従来のハイブリッドDNN-HMM ASRシステムと比較して,それらの大きな成功と統一モデリングパラダイムのため,大きな注目を集めている。ASRに関するE2Eモデリングフレームワークの広範な採用にもかかわらず,計算機支援発音学習(CAPT)における使用のためのE2Eフレームワークの調査,特にMispronuncation検出(MD)に関する研究の余地がある。応答において,まず,MDタスクへのハイブリッドCTCAttentアプローチの新しい利用を示し,CTCと注意ベースモデルの両方の長所を利用して,一方,電話レベル強制アラインメントの必要性の周りを得た。第2に,著者らは,MDタスクのためにより調整したE2Eモデルを作るために,テキスト迅速情報による入力増強を実行した。一方,提案フレームワークと協調するために2つのMD決定法を採用した。1)認識信頼尺度に基づく意思決定,2)音声認識結果に基づく簡易化。一連のマンダリンMD実験は,著者らのアプローチが既存のハイブリッドDNN-HMMシステムの処理パイプラインを単純化するだけでなく,系統的で実質的な性能改良をもたらすことを実証した。さらに,テキスト迅速による入力増強は,E2EベースMDアプローチに対する優れた有望性を保持すると思われる。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (1件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る