アラビア語音声認識に及ぼすdiacritizationの影響【Powered by NICT】

Al-Anzi Fawaz S.; AbuZeina Dia

文献

J-GLOBAL ID：201802272094798545 整理番号：18A0195113

アラビア語音声認識に及ぼすdiacritizationの影響【Powered by NICT】

The effect of diacritization on Arabic speech recogntion

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=18A0195113&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=18A0195113&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (2件)： ,
資料名：
巻： 2017 号： AEECT ページ： 1-5 発行年： 2017年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

アラビア語自動音声認識(ASR)は,自然言語処理(NLP)の成功した応用である。しかし,アラビア語形式テキストは,一般に,付加記号,異なる発音型を産生するなしで書かれている。すなわち,アラビア描画装置は,短母音を,事前知識を使用するリーダを可能にし,単語は,欠落した付加記号を推定する。音声認識では,テキスト訓練データのための二選択肢であるdiacritized(vowelizedと呼ばれる)または非diacritizedいずれかテキスト。しかし,非diacritizedテキストを用いた母音は学習過程におけるいくつかの混乱を導く可能性がある短い失われたアラビア語ASRへの挑戦を導入する可能性がある。このあいまいさのため,ASRシステムの最も重要な成分の一つであることを最適以下の音響モデルを作成した。本論文では,diacritizedと非diacritizedテキストを用いて性能を示した。実験では,Carnegie Mellon大学(CMU)PocketSphinx音声認識器を用いた。も訓練のための13.5時間と試験のための4.1時間を含む新しい「住宅」現代標準アラビア語(MSA)連続音声コーパスを用いた。コーパスのテキストた手動diacritized音響モデリングのために,音声tied-mixture(PTM)を使用した。実験結果は,非diacritizedテキストシステムは76.4%(すなわち1単語誤り率(WER))をスコア化しdiacritizedテキストベースシステムは63.8%を記録した。diacritized症例は付加記号のわずかな違いによる精度が少ないもことを示した;が,非diacritized症例は適切でアラビア語母語話者用の無欠陥である可能性がある。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】

, , , , , , ,
, , , , , , , 【Automatic Indexing@JST】

パターン認識 , 自然語処理

前のページに戻る