文献
J-GLOBAL ID:201802248192403427   整理番号:18A0823070

不整合クラウド消費:音声転写を獲得する潜在的スキルのマイニング【JST・京大機械翻訳】

Mismatched crowdsourcing: Mining latent skills to acquire speech transcriptions
著者 (4件):
資料名:
巻: 2017  号: ACSSC  ページ: 1277-1281  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自動音声認識(ASR)は音声をテキストに変換する。ASRは通常大量のラベル付きデータ,すなわちテキスト転写を伴う音声を用いて訓練される。しかしながら,多くの言語において,テキスト転写は発見するのが困難である。例えば,北陸とDinkaの両方において,いくつかの他の言語においてそれらすべての一次教育を受けたネイティブ話者を発見し,したがって,それら自身の言語における困難な記述を持っていた。幸いにも,あらゆる言語における音声は人間の口により生成され,人間の耳により解釈されるように設計されている。従って,大多数の言語(英語,言い,または中国語)の話者は,言語(Zulu,say,Cantonese)のいくつかの意味を作ることができる。言語特有の識別はほとんど失われるが,子音対母音のような普遍的な識別は正しく伝達される。著者らは,情報理論的復号器を用いてそのような不整合転写物を解読することができて,可能な自然言語転写の上で低エントロピー確率分布をもたらした。不整合転写物はASRを訓練するために使用できる。10時間の不整合転写物を12~48分の自然転写物と組み合わせると,利用可能な場合には,より低い電話誤り率が得られる。一方,自然の音素の在庫を知っていない場合には,2つ以上の注釈言語における不整合な転写物を用いて,自然の音素の目録(アノテーション言語の特徴的な特徴に依存するエントロピーを伴う)を推論することができる。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  自然語処理 

前のページに戻る