文献
J-GLOBAL ID:201702250748893595   整理番号:17A0662565

確率的転写からリソース不足言語に対するASR【Powered by NICT】

ASR for Under-Resourced Languages From Probabilistic Transcription
著者 (16件):
資料名:
巻: 25  号:ページ: 46-59  発行年: 2017年 
JST資料番号: W0508B  ISSN: 2329-9290  CODEN: ITASFA  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多くの資源不足言語では,テキストを見出すことができ,音声を見出すことが可能であるが,訓練自動音声認識(ASR)のための適切な転写された音声は利用できない。天然転写物の非存在下で,本論文では,確率的転写:波形の可能な音声転写産物上の確率質量関数の使用を提案した。確率的転写物の三源を実証した。最初に,自己訓練は十分に確立された半教師つき学習技術であり,言語横断ASRは最初のラベル付けされていない音声を標識し,次に同じラベルを用いて適応させた。第二に,不整合クラウドソーシングは,言語のnonspeakersはそれらの聴いている物が書くに求められている最近の技術である,それらのナンセンス転写物は第二言語音声知覚の雑音のあるチャネルモデルを用いた復号された。第三に,EEG分布符号化は,言語のnonspeakersはそれに聞く新しい技術であり,それらの皮質脳波応答信号は確率を示していると解釈される。ASRは天然転写物のない四言語で訓練した。不整合クラウドソーシングを用いた適応は,自己訓練よりも顕著にすぐれ,両方は,言語横断基線を大幅に陵駕した。EEG分布符号化とテキスト派生電話言語モデルの両方はミスマッチクラウドソーシングから誘導された確率的転写物の品質を改善することが示された。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る