限定データアプリケーションのための識別キーワードスポッティング【JST・京大機械翻訳】

Benisty Hadas; Katz Itamar; Crammer Koby; Malah David

文献

J-GLOBAL ID：201802217428303326 整理番号：18A0852226

限定データアプリケーションのための識別キーワードスポッティング【JST・京大機械翻訳】

Discriminative Keyword Spotting for limited-data applications

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=18A0852226&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=18A0852226&from=J-GLOBAL&jstjournalNo=W1590A") }}

著者 (4件)： , , ,
資料名：
巻： 99 ページ： 1-11 発行年： 2018年
JST資料番号： W1590A ISSN： 0167-6393 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：オランダ (NLD) 言語：英語 (EN)

モバイル機器は,世界中で広く使われているが,それは,しばしば文書化されていない局所言語や方言を話す人々によって頻繁に使われている。これらの言語に対しては,商用企業が自動音声認識(ASR)システムを開発するのに有益ではないので,これらの言語のユーザは,それらのデバイスの音声活性化特徴(しばしばキーワード分割,KWS)を利用することができない。標準KWS法は,音声信号の生成過程を統計的にモデル化することを目的とし,訓練のために記録され,転写された音声の時間を必要とし,したがって,制限されたデータシナリオには適切ではない。本論文では,開発者により容易に適用できる制限データシナリオに適した新しいKWS法を提案した。提案した方法は,事前に訓練されたGauss混合モデル(GMM)に関して得られた単語に対する新しいヒストグラム表現を用いる。文は,単語分類器によって得られた応答曲線から抽出された固定長のグローバル特徴ベクトルによって表現される。単語と文章分類器は,訓練集合サイズに対して典型的にロバストな識別手法を用いて訓練される。GMMを訓練するためのデータセットは,注釈が必要とされないために得ることが容易である。提案したシステムを隠れMarkovモデル(HMM)に基づくシステムと比較し,同じ低データ資源条件を用いて訓練し,最新のASRシステムに限られたデータシナリオを用いて訓練するか,または記録された音声の多くの時間を用いて訓練した。限られたデータ状況において,著者らのシステムは,HMMと同様に良好な性能を発揮する子供のクリーンな音声(CSLUデータセット)を除いて,すべての実験においてより良い性能を発揮する。ASRベンチマークは十分な訓練データなしでほとんど機能しないので,利用可能なデータを制限することなくそれを訓練した。この場合,ASRベンチマークは,すべての雑音条件に対して,成人の音声でテストした場合,より良い性能を示し,低から中程度のSNR値を持つ子供の音声でテストした場合,このシステムはより良い性能を示した。結果は,提案したシステムの利点とそれがより良く機能する条件を実証した。Copyright 2018 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

著者キーワード (7件)： , , , , , ,

情報加工一般 , パターン認識

, ,

前のページに戻る