文献
J-GLOBAL ID:201902268776554207   整理番号:19A1487697

統合時間-周波数マスキングによるディープニューラルネットワークを用いた音声信号の到着推定の時間差【JST・京大機械翻訳】

Time Difference of Arrival Estimation of Speech Signals Using Deep Neural Networks with Integrated Time-frequency Masking
著者 (2件):
資料名:
巻: 2019  号: ICASSP  ページ: 436-440  発行年: 2019年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
マイクロホン対に衝突する音波波面の時間差(TDoA)は音源に関する空間情報を運ぶ。しかし,捕捉された音声は典型的に動的非音声干渉源と雑音を含んでいる。したがって,TDoA推定は音声と干渉の間で変動する。深いニューラルネットワーク(DNNs)は,話者位置尤度関数から非音声成分をフィルターアウトするために,音響ソース局所化(ASL)のための時間周波数(TF)マスキングに適用されてきた。しかし,このタスクに対するTFマスクのタイプは明らかではない。第二に,DNNはTDoA値を推定しなければならないが,既存の解は代わりにTFマスクを推定する。これらの問題を克服するために,DNNベースのASL構造の一部としてのTFマスキングの直接定式化を提案した。さらに,提案したネットワークはオンラインで動作し,すなわちフレーム毎の推定を生成する。再帰層の使用と組み合わせて,話者関連TDoAsの逐次進行を利用した。異なるマイクロホン間隔による訓練は,推論における異なるマイクロホン対形状に対するモデル再利用を可能にする。干渉における音声のスマートフォン記録による実データ実験により,ネットワークの一般化能力を実証した。Copyright 2019 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 

前のページに戻る