文献
J-GLOBAL ID:201802217428303326   整理番号:18A0852226

限定データアプリケーションのための識別キーワードスポッティング【JST・京大機械翻訳】

Discriminative Keyword Spotting for limited-data applications
著者 (4件):
資料名:
巻: 99  ページ: 1-11  発行年: 2018年 
JST資料番号: W1590A  ISSN: 0167-6393  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
モバイル機器は,世界中で広く使われているが,それは,しばしば文書化されていない局所言語や方言を話す人々によって頻繁に使われている。これらの言語に対しては,商用企業が自動音声認識(ASR)システムを開発するのに有益ではないので,これらの言語のユーザは,それらのデバイスの音声活性化特徴(しばしばキーワード分割,KWS)を利用することができない。標準KWS法は,音声信号の生成過程を統計的にモデル化することを目的とし,訓練のために記録され,転写された音声の時間を必要とし,したがって,制限されたデータシナリオには適切ではない。本論文では,開発者により容易に適用できる制限データシナリオに適した新しいKWS法を提案した。提案した方法は,事前に訓練されたGauss混合モデル(GMM)に関して得られた単語に対する新しいヒストグラム表現を用いる。文は,単語分類器によって得られた応答曲線から抽出された固定長のグローバル特徴ベクトルによって表現される。単語と文章分類器は,訓練集合サイズに対して典型的にロバストな識別手法を用いて訓練される。GMMを訓練するためのデータセットは,注釈が必要とされないために得ることが容易である。提案したシステムを隠れMarkovモデル(HMM)に基づくシステムと比較し,同じ低データ資源条件を用いて訓練し,最新のASRシステムに限られたデータシナリオを用いて訓練するか,または記録された音声の多くの時間を用いて訓練した。限られたデータ状況において,著者らのシステムは,HMMと同様に良好な性能を発揮する子供のクリーンな音声(CSLUデータセット)を除いて,すべての実験においてより良い性能を発揮する。ASRベンチマークは十分な訓練データなしでほとんど機能しないので,利用可能なデータを制限することなくそれを訓練した。この場合,ASRベンチマークは,すべての雑音条件に対して,成人の音声でテストした場合,より良い性能を示し,低から中程度のSNR値を持つ子供の音声でテストした場合,このシステムはより良い性能を示した。結果は,提案したシステムの利点とそれがより良く機能する条件を実証した。Copyright 2018 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
情報加工一般  ,  パターン認識 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る