プレプリント
J-GLOBAL ID:202202210778365544   整理番号:22P0309587

SelfRemaster:チャネルモデリングを用いた解析合成アプローチによる自己教師付き音声復元【JST・京大機械翻訳】

SelfRemaster: Self-Supervised Speech Restoration with Analysis-by-Synthesis Approach Using Channel Modeling
著者 (5件):
資料名:
発行年: 2022年03月24日  プレプリントサーバーでの情報更新日: 2022年06月27日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
対音声コーパスのない自己監督音声復元法を提案した。以前の一般的音声復元法は,高品質音声コーパスに様々な歪みを適用することにより生成された人工的ペアデータを使用するので,実際のデータの音響歪みを十分に表現できず,応用性を制限する。著者らのモデルは,劣化音声の記録プロセスをシミュレートする解析,合成,およびチャネルモジュールから成り,自己監督された方法で実際の劣化音声データで訓練される。解析モジュールは,分解音声から無歪音声特徴と歪特徴を抽出し,一方,合成モジュールは回復音声波形を合成し,チャネルモジュールは音声波形に歪を加える。また,著者らのモデルは,音響歪だけが劣化した音声から抽出され,任意の高品質オーディオに追加されるオーディオ効果転送を可能にする。シミュレーションと実データの両方による実験的評価は,著者らの方法が以前の教師つき法よりも有意に高い品質の音声復元を達成し,実際の劣化音声材料への適用性を示唆した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 

前のページに戻る