文献
J-GLOBAL ID:201902260479369906   整理番号:19A2206419

音声強調のための位相敏感情報を組み込んだマスク推定【JST・京大機械翻訳】

Mask estimation incorporating phase-sensitive information for speech enhancement
著者 (2件):
資料名:
巻: 156  ページ: 101-112  発行年: 2019年 
JST資料番号: D0559A  ISSN: 0003-682X  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深いニューラルネットワーク(DNN)ベースの方法に対して,時間-周波数(T-F)マスクは訓練ターゲットとして一般的に使用される。しかしながら,それらのほとんどは位相情報に焦点を合わせていないが,最近の研究は,T-Fマスクへの位相情報の組込みが,強化された音声の音声品質の改善を効果的に助けることができることを明らかにした。本論文では,位相情報を考慮したT-Fマスクを得るための二つの技術を提案した。最初の技術において,2つの位相差のスペクトル構造についての特性,それはクリーンとノイズのある音声の間の位相差(PD)とノイズとノイズのある音声の間のPDを含んで,最初に議論した。次に,2つのPDの特定の特性を考慮して,パラメータが2つの前述のPDの余弦によって制御されるパラメトリック理想比マスク(IRM)を提案した。それは位相制約(BIRMP)を有する有界IRMと呼ばれる。第二の技術では,複雑な音声スペクトルの一般化最大事後確率(GMAP)確率に基づく最適推定器を提案し,複雑スペクトル(OGMAPC)の最適GMAP推定として定義した。OGMAPC推定器は,スペクトルの大きさと位相の事前情報のスケールを動的に調整することができる。DNNベースの方法における音声位相の難しい予測可能性を考慮して,第2の技術は位相情報を有する最適な大きさマスクを計算するためにOGMAPC推定器のスペクトルの大きさ部分を利用して,その理想値をDNN訓練のために使用した。実験は,提案方法が参照方法を上回ることができることを示した。Copyright 2019 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  生体代行装置 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る