抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自己監督学習,特に対照的学習は,多くの深い学習研究分野の開発に対して顕著な貢献をした。最近,音響信号処理分野での研究者は,より良い音楽表現のために,その成功と活用されたコントラスト学習に気付いた。典型的には,既存の手法は同じ音楽からサンプリングされた2つの歪んだオーディオセグメント間の類似性を最大化する。言い換えれば,それらは音楽レベルで意味的一致を確実にする。しかし,これらの粗粒法は,フレームレベルで,いくつかの必須または雑音のある要素を無視し,それは,音楽の有効な表現を学習するためのモデルに有害であるかもしれない。この目的に向けて,本論文は,PEMRと略称される,コントラスト学習フレームワークに基づく,Music表現のための,新しいポジティブ-nEgativeフレームマスクを提案する。具体的には,PEMRは,Log-Melスペクトログラム上のフレームマスクを生成するために,変圧器ブロックを活用する,正のNegative Mask生成モジュールを組み込んだ。重要な成分または必須成分をそれぞれマスキングすることにより,自己増強陰性および陽性試料を生成することができた。著者らは,同じ音楽からサンプリングした自己増強ポジティブ/ネガティブの両方に適応するための新しいコントラスト学習目的を考案した。4つの公開データセットに関する実験を行った。2つの音楽関連下流タスクの実験結果,音楽分類,およびカバー歌同定は,PEMRによって学習された音楽表現の一般化能力と伝達性を実証する。【JST・京大機械翻訳】