文献
J-GLOBAL ID:201202276020246556   整理番号:12A0748549

スペクトル変化量のピーク間隔・F0・MFCCを用いた歌声と朗読音声の自動識別システム

A System for Automatic Discrimination between Singing and Speaking Voices on the Basis of Peak Interval of Spectral Change, F0, and MFCC
著者 (7件):
資料名:
巻: 2011  号:ページ: ROMBUNNO.MUS-94,NO.13  発行年: 2012年04月15日 
JST資料番号: Z0031C  ISSN: 2186-2583  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,歌声と朗読音声を識別するシステムについて述べる。入力は無雑音音声,出力は歌声と朗読音声それぞれの尤度(連続値)である。従来,スペクトル包絡(MFCC)と基本周波数(F0)の時間変化に基づいた識別システムが報告されている。これらの特徴量に基づく識別器に,スペクトル変化量のピーク間隔という,音素継続時間に関連する特徴量に基づく識別器を加え,入力音声長に応じて各識別器への重みを変化させた。実験の結果,従来システムでは1秒の音声に対し86.7%の精度であったのに対し,本システムでは90.2%という結果を得た。本システムが実時間で動作するデモアプリケーションについても述べる。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (4件):
分類
JSTが定めた文献の分類名称とコードです
楽器音響  ,  音声処理  ,  信号理論  ,  システム・制御理論一般 

前のページに戻る