文献
J-GLOBAL ID:202102221325241291   整理番号:21A1629861

ミスマッチHRTF条件における深層ニューラルネットワークと親和性伝搬クラスタリングに基づく両耳音定位【JST・京大機械翻訳】

Binaural sound localization based on deep neural network and affinity propagation clustering in mismatched HRTF condition
著者 (5件):
資料名:
巻: 2020  号:ページ: 1-16  発行年: 2020年 
JST資料番号: U8251A  ISSN: 1687-4722  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
耳音音源定位は重要で広く使われる知覚ベース法であり,頭部関連伝達関数(HRTF)に基づく多くの研究者による機械学習研究に適用された。HRTFはヒト生理学的構造に密接に関連しているので,HRTFsは個体間で異なる。今日までの関連する機械学習研究は,残響または雑音の多い環境,または複数の同時能動音源の条件における二耳の局在化に焦点を当てる傾向がある。対照的に,訓練と試験セットを生成するのに用いたHRTFが異なっているミスマッチHRTF条件は,ほとんど研究されていない。この不整合は局在化性能の劣化をもたらす。この問題に対する基本的な解決策は,多くのデータを導入し,一般化性能を改善し,それは大いに必要とする。しかし,データ体積を単純に増加させると,データ非効率をもたらす。本論文では,ディープニューラルネットワーク(DNN)とクラスタリングに基づくデータ効率の良い方法を提案し,不整合HRTF条件におけるバイノーラル位置確認性能を改善した。第1に,著者らは,分類DNNによって,バイノーラルキューと音源位置確認の間の関係を分析した。異なるHRTFsを用いて訓練と試験セットをそれぞれ発生させた。これに基づき,異なる試験セットで各訓練セットによって訓練されたDNNモデルの位置確認性能を研究した。結果は,異なる試験セットに関する同じモデルの位置確認性能が異なっていることを示して,一方,同じ試験セットに関するいろいろなモデルの位置確認性能は,類似した可能性があった。結果はまた,クラスタ化傾向を示す。第二に,種々のHRTFsをいくつかのクラスタに分割した。最後に,各クラスタ中心の対応するHRTFを選択し,新しい訓練セットを生成し,より一般化されたDNNモデルを訓練した。実験結果は,提案方法がミスマッチHRTF条件においてベースライン方法より良い一般化性能を達成して,多くのHRTFsで訓練されたDNNとほとんど等しい性能を持ち,それは提案方法がデータ効率的であることを示した。Please refer to the publisher for the copyright holders. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
聴覚・音声モデル  ,  音響信号処理 
引用文献 (30件):
  • IEEE/ACM Trans Audio Speech Lang Process; Binaural sound localization based on reverberation weighting and generalized parametric mapping; C. Pang, H. Liu, J. Zhang, X. Li; 25; 8; 2017; 1618-32; 10.1109/TASLP.2017.2703650; citation_id=CR1
  • IEEE Trans Acoust Speech Signal Process; The generalized correlation method for estimation of time delay; C. Knapp, G. Carter; 24; 4; 1976; 320-327; 10.1109/TASSP.1976.1162830; citation_id=CR2
  • J Acoust Soc Am; Variance bounds for passively locating an acoustic source with a symmetric line array; G. C. Carter; 62; 4; 1977; 922-926; 10.1121/1.381623; citation_id=CR3
  • IEEE Trans Antenn Propag; Multiple emitter location and signal parameter estimation; R. Schmidt; 34; 3; 1986; 276-280; 10.1109/TAP.1986.1143830; citation_id=CR4
  • IEEE Trans Acoust Speech Signal Process; ESPRIT-estimation of signal parameters via rotational invariance techniques; R. Roy, T. Kailath; 37; 7; 1989; 984-995; 10.1109/29.32276; citation_id=CR5
もっと見る

前のページに戻る