抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・環境音を含む音響信号とそのラベル情報のペアデータを使って,音響情報とラベル情報の対応を獲得することを検討。
・音響信号とラベルの共起に基づいて,これらを共通の潜在空間で表現することで個別のラベルに対応する音響信号のスペクトログラム中の領域が学習されることを期待。
・最終的にこの潜在空間を利用して生成されるスペクトログラムマスクを音源分離のために利用することが目標。
・これは,対象とする信号の音響的特徴のみによるのではなく,意味的情報に基づく音源分離を目指す試み。
・本稿では,U-net構造を用いた音源分離手法と潜在空間を用いた類似度に基づく学習を組み合わせることで,低コストな弱ラベルデータから音源分離のためのスペクトログラムマスクを生成。
・含まれる音の数が2音で音の重畳なしの条件下において,スペクトログラム上に大まかなマスクの出力ができることを確認。