文献
J-GLOBAL ID:201202200772640486   整理番号:12A1564000

会話電話音声認識に対する部分空間Gauss混合モデルの教師なし学習

UNSUPERVISED TRAINING OF SUBSPACE GAUSSIAN MIXTURE MODELS FOR CONVERSATIONAL TELEPHONE SPEECH RECOGNITION
著者 (3件):
資料名:
巻: 2012 Vol.7  ページ: 4829-4832  発行年: 2012年 
JST資料番号: E0316B  ISSN: 1520-6149  資料種別: 会議録 (C)
記事区分: 短報  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
資源の乏しい言語や方言の場合には,多量の訓練データの収集が大語彙連続音声認識の隘路となり,この問題の克服に教師なし学習手法が注目されている。またデータのスパース性に対応する技法として,比較的低次元ベクトルの集合を利用して,状態出力分布間の変動を捕捉する部分空間Gauss混合モデル(SGMM)がある。本論文は,この両者を組合せ,資源の乏しい会話電話音声(CTS)認識タスクに対する,SGMMモデルの教師なし学習を考察した。学習手順として,シードモデル学習,転写生成,データ選択,モデル再学習を反復し,音響モデルを逐次詳細化する手順を示した。この手順をGMMとSGMMの両方に適用し,公開されている2種の英語会話電話音声コーパスを利用して実験を行い,両モデルの性能を比較した。提案した手順中の音声データの手作業による転写は,低資源シナリオで極めて有効であることを示した。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 

前のページに戻る