文献
J-GLOBAL ID:202102224774013131   整理番号:21A1938629

変分自己符号化器を用いた距離学習による楽器音の音高・音色分離表現

著者 (5件):
資料名:
巻: 2021  号: MUS-131  ページ: Vol.2021-MUS-131,No.56,1-6 (WEB ONLY)  発行年: 2021年06月11日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,任意の楽器音を音高と音色の潜在表現に分離するための表現学習手法について述べる.このような分離はこれまでにも,変分自己符号化器(variational autoencoder,VAE)を用いて,特に予め指定された楽器群を対象に試みられてきた.しかし,得られる潜在表現は人間の知覚に合致しておらず,空間を直感的に解釈することが困難であった.この問題を解決するため,本研究ではVAEの各潜在空間に対して距離学習手法を導入し,類似した(していない)音高または音色同士が,潜在空間において近く(遠く)なるように埋め込みを行う.具体的には,同じ(異なる)音高または音色間の潜在距離が最小(最大)となるように,VAEの学習において対比的損失関数を追加する.さらに,実際の音高あるいは音色名ではなく,二つの音の音高あるいは音色が同一かどうかのみの情報を用いた,弱教師あり学習を行う.これにより,未知楽器に対する汎化性能の向上を実現する.実験では,提案手法によって未知楽器に対しても,音高と音色がクラスター化された,より良い構造の分離表現を獲得できることを確認した.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
楽器音響 
引用文献 (31件):
  • Chen, X., Duan, Y., Houthooft, R., Schulman, J., Sutskever, I. and Abbeel, P.: InfoGAN: Interpretable representation learning by information maximizing generative adversarial nets, Advances in Neural Information Processing Systems (NIPS), pp. 2172-2180 (2016).
  • Ishfaq, H., Hoogi, A. and Rubin, D.: TVAE: Triplet-Based Variational Autoencoder using Metric Learning, arXiv:1802.04403, pp. 1-4 (2018).
  • Higgins, I., Matthey, L., Pal, A., Burgess, C., Glorot, X., Botvinick, M., Mohamed, S. and Lerchner, A.: Beta-VAE: Learning basic visual concepts with a constrained variational framework, International Conference on Learning Representations (ICLR) (2017).
  • Kim, H. and Mnih, A.: Disentangling by factorising, International Conference on Machine Learning (ICML)(2018).
  • Esmaeili, B., Wu, H., Jain, S., Bozkurt, A., Siddharth, N., Paige, B., Brooks, D. H., Dy, J. and Meent, J.: Structured Disentangled Representations, Proceedings of Machine Learning Research (PMLR), pp. 2525-2534(2019).
もっと見る

前のページに戻る