プレプリント
J-GLOBAL ID:202202208658564093   整理番号:22P0324370

音声分解と補助特徴に基づく音響-音響反転【JST・京大機械翻訳】

Acoustic-to-articulatory Inversion based on Speech Decomposition and Auxiliary Feature
著者 (6件):
資料名:
発行年: 2022年04月02日  プレプリントサーバーでの情報更新日: 2022年04月02日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音響対関節反転(AAI)は,音声信号からアーチファクトの動きを得ることである。これまで,話者独立AIIを達成することは,限られたデータを与える課題として残っている。そのうえ,ほとんどの現在の研究は,入力としてオーディオ音声だけを使用するので,避けられない性能ボトルネックを引き起こす。これらの問題を解決するために,まず音声分解ネットワークを事前訓練し,音声を話者埋め込みとコンテンツ埋込みに,話者独立事例に適応させる新しい個人化音声特徴として分解した。第2に,AAIをさらに改善するために,著者らは,上記の個人化音声特徴から口唇補助特徴を推定するために,新しい補助特徴ネットワークを提案した。3つの公開データセットに関する実験結果は,音声特徴だけを使用する最先端技術と比較して,提案方法が平均RMSEを0.25減少して,話者依存事例において平均相関係数を2.0%増加させることを示した。より重要なことに,平均RMSEは0.29減少し,平均相関係数は話者独立事例で5.0%増加した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る