文献
J-GLOBAL ID:202002257542372257   整理番号:20A0144936

音声強調のための注意に基づく話者独立オーディオビジュアル深層学習モデル【JST・京大機械翻訳】

An Attention Based Speaker-Independent Audio-Visual Deep Learning Model for Speech Enhancement
著者 (3件):
資料名:
巻: 11962  ページ: 722-728  発行年: 2020年 
JST資料番号: H0078D  ISSN: 0302-9743  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声強調は,雑音環境における音声品質を改善することを目的としている。ほとんどの音声強調法は入力として音声データのみを用いるが,結合ビデオ情報はより良い結果を達成することができる。本論文では,単一チャネル音声強調のための注意に基づく話者独立聴覚視覚的深学習モデルを提案した。著者らは,より重要な特徴に焦点を合わせるために,ビデオ特徴抽出モジュールにおける時間的注意と空間的注意の両方を適用した。次に,オーディオ特徴とビデオ特徴を,聴覚視覚特徴として時間次元に沿って連結した。提案したビデオ特徴抽出モジュールは,広範な修正なしにオーディオのみのモデルに接続できる。結果は,提案した方法が最近の聴覚視覚音声強調法より良い結果を達成できることを示した。Copyright 2020 Springer Nature Switzerland AG Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 

前のページに戻る