文献
J-GLOBAL ID:201702264497148183   整理番号:17A1650957

スパーススペクトル回復を用いたメル周波数ケプストラム係数からのピッチ予測【Powered by NICT】

Pitch prediction from Mel-frequency cepstral coefficients using sparse spectrum recovery
著者 (2件):
資料名:
巻: 2017  号: NCC  ページ: 1-6  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本研究では,メル周波数ケプストラム係数(MFCC)ベクトルからのピッチを予測するための手法を提案した。以前のピッチ予測法は,Gauss混合モデルと隠れMarkovモデルのような統計的モデルに基づいている。本論文では,MFCCベクトルからのピッチを推定するための三段階法を提案した。Melフィルタバンクエネルギー(MFBEs)はMFCCベクトルから推定した。第二に,有声音スペクトルのスパース性を利用するMFBEからスペクトルを推定する新しい方法を提案した。最後に,ピッチは回収されたスペクトルから推定した。もピッチ予測誤差に及ぼすMFCC計算における離散コサイン変換(DCT)係数の切断の異なるレベルの影響を調べた。MFCCベクトルからのピッチを予測するベースラインとして深い神経回路網(DNN)に基づく予測因子を用いた。CMU北極とKEELEデータベースを用いた実験では,13次元および26次元MFCCベクトルはそれぞれピッチ予測に使用した場合,提案した三段階法はDNNからに比べてデータベースと性別予測ピッチの平均RMSEにおける~8Hzと~5Hzの低下をもたらすにわたって,より優れた一般化したことを示した。また,スパース性拘束はより低いピッチ値でスペクトルの回復に優れていることを見出した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る