会話電話音声認識に対する部分空間Gauss混合モデルの教師なし学習

MA Zejun; WANG Xiaorui; XU Bo

文献

J-GLOBAL ID：201202200772640486 整理番号：12A1564000

会話電話音声認識に対する部分空間Gauss混合モデルの教師なし学習

UNSUPERVISED TRAINING OF SUBSPACE GAUSSIAN MIXTURE MODELS FOR CONVERSATIONAL TELEPHONE SPEECH RECOGNITION

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=12A1564000&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=12A1564000&from=J-GLOBAL&jstjournalNo=E0316B") }}

著者 (3件)： , ,
資料名：
巻： 2012 Vol.7 ページ： 4829-4832 発行年： 2012年
JST資料番号： E0316B ISSN： 1520-6149 資料種別：会議録 (C)
記事区分：短報発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

資源の乏しい言語や方言の場合には,多量の訓練データの収集が大語彙連続音声認識の隘路となり,この問題の克服に教師なし学習手法が注目されている。またデータのスパース性に対応する技法として,比較的低次元ベクトルの集合を利用して,状態出力分布間の変動を捕捉する部分空間Gauss混合モデル(SGMM)がある。本論文は,この両者を組合せ,資源の乏しい会話電話音声(CTS)認識タスクに対する,SGMMモデルの教師なし学習を考察した。学習手順として,シードモデル学習,転写生成,データ選択,モデル再学習を反復し,音響モデルを逐次詳細化する手順を示した。この手順をGMMとSGMMの両方に適用し,公開されている2種の英語会話電話音声コーパスを利用して実験を行い,両モデルの性能を比較した。提案した手順中の音声データの手作業による転写は,低資源シナリオで極めて有効であることを示した。

, , , , , , , , , , , , ,
, , , , , , , ,

パターン認識

, , , , ,

前のページに戻る