プレプリント
J-GLOBAL ID:202202203343347424   整理番号:22P0342208

HarmoF0:ピッチ推定のための対数スケール拡張畳込み【JST・京大機械翻訳】

HarmoF0: Logarithmic Scale Dilated Convolution For Pitch Estimation
著者 (4件):
資料名:
発行年: 2022年05月02日  プレプリントサーバーでの情報更新日: 2022年06月20日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音,特に音楽は,周波数次元に散乱した様々な調和成分を含む。正常畳み込みニューラルネットワークは,これらの倍音を観測するのは難しい。本論文では,対数スケールスペクトログラムにおける高調波構造を効率的に捉えるために,多重速度拡張因果畳込み(MRDC-Conv)法を導入した。高調波はピッチ推定に役立ち,多くの音響処理応用にとって重要である。完全畳込みネットワークであるHarmoF0を提案し,ピッチ推定におけるMRDC-Convと他の拡張畳込みを評価した。結果は,このモデルがDeepF0を凌駕し,3つのデータセットで最先端の性能をもたらし,同時に90%以上のパラメータを減らすことを示した。また,強い雑音抵抗とより少ないオクターブ誤差を持つことを見出した。コードと事前訓練モデルはhttps://github.com/WX Wei/HarmoF0で利用可能である。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  パターン認識 

前のページに戻る