文献
J-GLOBAL ID:201702252786700844   整理番号:17A0371514

話者の年齢と性別分類のための深い神経回路網フレームワークと形質転換したMFCC【Powered by NICT】

Deep neural network framework and transformed MFCCs for speaker’s age and gender classification
著者 (3件):
資料名:
巻: 115  ページ: 5-14  発行年: 2017年 
JST資料番号: T0426A  ISSN: 0950-7051  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
話者年齢と性別分類は音声処理における最も挑戦的な問題の一つである。多くの研究は改善のための特徴抽出と分類器の設計に焦点を当てて行われているが,分類精度は満足されていない。話者の年齢と性別を同定するのに重要な点はロバストな特徴を生成し,詳細な分類器を設計することである。年齢と性別情報は,話者の音声のような多くの因子,背景雑音,発話内容,および音声発散に陥りやすいにおいて隠されていた。多くの応用におけるDNN構造の成功は,本研究を動機づけDNNと共にBNF抽出器を用いた新しい話者の年齢と性別分類システムを提案した。本研究は二の主要な寄与:DNNと発生形質転換したMFCC特徴集合の重みを正規化するために誤って分類されたクラス間の共有クラスラベルの導入を有していた。提案したシステムは,全ての発話に対する結合状態トライフォン,年齢と性別分類で初めてDNNの出力層のための標識として用いられるを見つけるためにH TK使用する。BNF抽出器を用いて形質転換したMFCC特徴を抽出することである。新しい特徴の性能評価を二つの分類器,DNNおよびIベクトルにより行った。変換MFCCは話者の年齢と性別分類における従来のMFCCより効果的であることを観測した。変換されたMFCCを用いて,総合分類精度は約13%改善された。Copyright 2017 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 

前のページに戻る