文献
J-GLOBAL ID:201502213228722246   整理番号:15A0263030

会議音声における音声区間検出のためのDeep Neural Networkとクロス適応の検討

Investigation of Deep Neural Network and Cross-adaptation for Voice Activity Detection in Meeting Speech
著者 (3件):
資料名:
巻: 114  号: 365(SP2014 106-126)  ページ: 19-24  発行年: 2014年12月08日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声区間検出(VAD)では,雑音や残響の影響によりVAD性能が大幅に低下するため,そのような環境に対して頑健なVADシステムの構築が求められている。本研究ではDeep Neural Network(DNN)を用いたVAD手法における性能の改善を目指し,VADモデルの環境適応を提案する。DNNの適応手法として,適応する対象の未知データの自動認識処理を用いた教師なし適応が検討されているが,一般的に教師なし適応は誤りを含む教師信号による学習を行うため,DNNの識別性能が高いほど誤りを忠実に再現してしまう。そのため,誤り傾向の異なる複数の識別システムを用いることで誤りの影響を低減するDNNによるクロス適応が提案されている。本研究ではDNNとは誤り傾向の異なるGMM,SVMの認識結果を適応用の教師ラベルとして用いることによって,適応性能が向上し,雑音と残響に頑健なVADができることを示す。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  人工知能 
引用文献 (10件):
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る