文献
J-GLOBAL ID:202002261024596115   整理番号:20A0801545

環境音とラベル情報のデュアルエンコーダに基づくスペクトログラムマスクの生成

Generating spectrogram mask for environmental sounds based on dual encoder of sounds and labels
著者 (5件):
資料名:
巻: 2020  号: 春季  ページ: ROMBUNNO.2-P-14  発行年: 2020年03月02日 
JST資料番号: G0381C  ISSN: 1880-7658  資料種別: 会議録 (C)
記事区分: 短報  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・環境音を含む音響信号とそのラベル情報のペアデータを使って,音響情報とラベル情報の対応を獲得することを検討。
・音響信号とラベルの共起に基づいて,これらを共通の潜在空間で表現することで個別のラベルに対応する音響信号のスペクトログラム中の領域が学習されることを期待。
・最終的にこの潜在空間を利用して生成されるスペクトログラムマスクを音源分離のために利用することが目標。
・これは,対象とする信号の音響的特徴のみによるのではなく,意味的情報に基づく音源分離を目指す試み。
・本稿では,U-net構造を用いた音源分離手法と潜在空間を用いた類似度に基づく学習を組み合わせることで,低コストな弱ラベルデータから音源分離のためのスペクトログラムマスクを生成。
・含まれる音の数が2音で音の重畳なしの条件下において,スペクトログラム上に大まかなマスクの出力ができることを確認。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音響信号処理  ,  音声処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る