文献
J-GLOBAL ID:201702231608352123   整理番号:17A1034951

連続音声認識タスクのための調音と音響空間の結合モデリング【Powered by NICT】

Joint modeling of articulatory and acoustic spaces for continuous speech recognition tasks
著者 (8件):
資料名:
巻: 2017  号: ICASSP  ページ: 5205-5209  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
調音情報は音声の変動性を効果的にモデル化でき,変化する音響条件下での音声認識性能を改善することができる。不特定話者調音モデルの学習常に挑戦されてきたが,調音と音響空間における話者固有情報は,音声調音空間逆モデリングの複雑さ,その固有の非線形性と非一意性に起因する不良設定問題を既にを増加した。本論文では,音声データのマッピングその対応する調音空間への深層ニューラルネットワーク(DNN)と畳込みニューラルネットワーク(CNN)を用いて調べた。著者らの結果は,CNNモデルは音声逆転のDNN対応物よりも優れていることを示した。添加では,三種類の異なる標準音声認識タスクのための音声から調音軌跡を生成するために逆モデルを使用した。音響特徴の空間時間特徴を保持しながら調音特徴の時間的変調を効果的にモデル化するために,音響および調音空間の両方を同時に学習への接合モデリング戦略を検討した。多重音声認識タスクからの結果を,音響データと調音空間が一つの共通した目的関数を持つ結合的に学習される場合調音特徴は認識性能を改善できることを示す。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  人工知能 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る