識別音響単語埋込み:Tecurrentニューラルネットワークに基づくアプローチ【Powered by NICT】

Settle Shane; Livescu Karen

文献

J-GLOBAL ID：201702265426994052 整理番号：17A0797872

識別音響単語埋込み:Tecurrentニューラルネットワークに基づくアプローチ【Powered by NICT】

Discriminative acoustic word embeddings: Tecurrent neural network-based approaches

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A0797872&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A0797872&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (2件)： ,
資料名：
巻： 2016 号： SLT ページ： 503-510 発行年： 2016年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

可変長単語音声セグメントの固定次元ベクトル表現音響単語埋込みは,音声認識と質問ごと事例探索のようなタスクのために考慮され始めている。同じ単語に対応する音声セグメントで類似していたようにこのような埋め込みは,識別的に学ぶことができる,異なる単語に対応するセグメントのための異種であった。最近の研究は,音響単語埋込みは質問ごと事例探索と関連単語弁別課題に及ぼす動的時間ワーピングをより優れていることが分かった。しかし,埋め込みモデルと訓練アプローチの空間はまだ相対的に解明されていない。本論文では,リカレントニューラルネットワーク(RNN)に基づく新しい識別埋込みモデルを提示した。以前の研究,特に単語分類のためのクロスエントロピー損失と「シャムネットワーク」訓練環境における分離した同じ単語と異なる単語対することを目的とした明示的に対照的な損失に成功してきた訓練損失を考察した。分類器ベースとシャムRNN埋込みは,単語弁別課題に以前に報告された結果よりも改善し,シャムRNN優れている分類モデルであることを見出した。添加では,学習した埋込の解析と次元性とネットワーク構造のような変数の効果を示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】

, , , , , ,
, , , 【Automatic Indexing@JST】

パターン認識

, , , ,

前のページに戻る