自己管理による前訓練オーディオ表現【JST・京大機械翻訳】

Tagliasacchi Marco; Gfeller Beat; Quitry Felix de Chaumont; Roblek Dominik

文献

J-GLOBAL ID：202002291162743172 整理番号：20A1072338

自己管理による前訓練オーディオ表現【JST・京大機械翻訳】

Pre-Training Audio Representations With Self-Supervision

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=20A1072338&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=20A1072338&from=J-GLOBAL&jstjournalNo=W0576A") }}

著者 (4件)： , , ,
資料名：
巻： 27 ページ： 600-604 発行年： 2020年
JST資料番号： W0576A ISSN： 1070-9908 CODEN： ISPLEM 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

汎用音声表現を学習する方法として自己監視を調べた。具体的には,2つの自己教師つきタスクを提案した。これらは,過去と将来のスライスからのスペクトログラムスライスの再構成と,同じオーディオクリップからランダムに抽出された2つの短いオーディオセグメント間の距離を推定するTemporalGapからなる。著者らは,異なる下流タスクへの自己監視転送を介して学習された表現,事前訓練された埋め込みのトップにおけるタスク特異線形分類器の訓練,または各下流タスクに対するモデルエンドツーエンドの微調整を評価した。著者らの結果は,Audo2Vecにより学習された表現が,Audisetに関する完全教師つき訓練により学習されたものより良いことを示した。さらに,微調整Audi2Vec表現により,限られたデータが利用可能な場合には,各タスクにおけるスクラッチから訓練された完全教師つきモデルの性能を向上させることができ,ラベル効率を向上させることができる。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , ,
, , , 【Automatic Indexing@JST】

音声処理 , パターン認識

, , ,

前のページに戻る