LibriSpeech:公開領域音声図書を利用したASRコーパス

PANAYOTOV Vassil; CHEN Guoguo; POVEY Daniel; KHUDANPUR Sanjeev

文献

J-GLOBAL ID：201602253982347320 整理番号：16A0544431

LibriSpeech:公開領域音声図書を利用したASRコーパス

LIBRISPEECH: AN ASR CORPUS BASED ON PUBLIC DOMAIN AUDIO BOOKS

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=16A0544431&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=16A0544431&from=J-GLOBAL&jstjournalNo=E0316B") }}

著者 (4件)： , , ,
資料名：
巻： 2015 Vol.7 ページ： 5206-5210 発行年： 2015年
JST資料番号： E0316B ISSN： 1520-6149 資料種別：会議録 (C)
記事区分：短報発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

インターネット上のマルチメディアコンテンツ量が急増し,統計モデル訓練用の自動データ収集が実現した。しかし話し言葉音声認識システムの訓練とテストに適した,自由に利用できる英語音声コーパスはまだ十分なものがない。本論文は,16kHzでサンプリングした1000時間の音声を含む,音声読み上げデータ集合LibriSpeechコーパスを紹介した。このコーパスは,公開領域音声図書創成を目的とするLibriVoXボランティアプロジェクトが開発した音声図書からの英語音声読み上げデータを利用して作成した。対応するテキストと自動整合,セグメンテーションし,雑音を含むセグメントは除去して音声認識システム訓練に適した音声コーパスとした。ウオールストリートジャーナル(WSJ)テスト集合による実験で,WSJ自身よりも,LibriSpeechで訓練した音響モデルの方が誤り率が低いという結果を得た。

, , , , , , , , , , , , , , , , , , , ,
, , , , , , ,

パターン認識

, , , ,

前のページに戻る