文献
J-GLOBAL ID:201602253982347320   整理番号:16A0544431

LibriSpeech:公開領域音声図書を利用したASRコーパス

LIBRISPEECH: AN ASR CORPUS BASED ON PUBLIC DOMAIN AUDIO BOOKS
著者 (4件):
資料名:
巻: 2015 Vol.7  ページ: 5206-5210  発行年: 2015年 
JST資料番号: E0316B  ISSN: 1520-6149  資料種別: 会議録 (C)
記事区分: 短報  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
インターネット上のマルチメディアコンテンツ量が急増し,統計モデル訓練用の自動データ収集が実現した。しかし話し言葉音声認識システムの訓練とテストに適した,自由に利用できる英語音声コーパスはまだ十分なものがない。本論文は,16kHzでサンプリングした1000時間の音声を含む,音声読み上げデータ集合LibriSpeechコーパスを紹介した。このコーパスは,公開領域音声図書創成を目的とするLibriVoXボランティアプロジェクトが開発した音声図書からの英語音声読み上げデータを利用して作成した。対応するテキストと自動整合,セグメンテーションし,雑音を含むセグメントは除去して音声認識システム訓練に適した音声コーパスとした。ウオールストリートジャーナル(WSJ)テスト集合による実験で,WSJ自身よりも,LibriSpeechで訓練した音響モデルの方が誤り率が低いという結果を得た。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る