プレプリント
J-GLOBAL ID:202202214245238449   整理番号:22P0310224

話者に依存しない音声分離のための畳込みネットワークの変種における二重経路戦略による再帰層の埋込み【JST・京大機械翻訳】

Embedding Recurrent Layers with Dual-Path Strategy in a Variant of Convolutional Network for Speaker-Independent Speech Separation
著者 (2件):
資料名:
発行年: 2022年03月25日  プレプリントサーバーでの情報更新日: 2022年06月16日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
話者独立音声分離は,深層ニューラルネットワーク(DNN)の開発により近年顕著な性能を達成した。従来の畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)から先進変圧器までの様々なネットワークアーキテクチャを,分離性能を改善するために,発見的に設計した。しかしながら,最先端のモデルは,通常,大きなモデルサイズ,巨大なメモリ消費および計算量のような計算に関連したいくつかの欠陥に悩まされる。性能と計算効率の間のバランスを見つけ,さらに従来のネットワーク構造のモデリング能力を探るために,著者らは,RNNと,音声分離問題に対処するために畳み込みネットワークの新しく提案した変異体を結合した。二重経路戦略の助けを借りて,この変異体の基本ブロックに2つのRNNを埋め込むことにより,提案したネットワークは局所情報と大域的依存性を効果的に学習できる。さらに,4段階構造は,特徴寸法が増加するにつれて,より微細で微細なスケールで分離手順を徐々に行うことを可能にする。種々のデータセットに関する実験結果は,提案した方法の有効性を証明し,分離性能と計算効率の間のトレードオフが十分に達成されることを示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  人工知能 

前のページに戻る