抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
アラビア語自動音声認識(ASR)は,自然言語処理(NLP)の成功した応用である。しかし,アラビア語形式テキストは,一般に,付加記号,異なる発音型を産生するなしで書かれている。すなわち,アラビア描画装置は,短母音を,事前知識を使用するリーダを可能にし,単語は,欠落した付加記号を推定する。音声認識では,テキスト訓練データのための二選択肢であるdiacritized(vowelizedと呼ばれる)または非diacritizedいずれかテキスト。しかし,非diacritizedテキストを用いた母音は学習過程におけるいくつかの混乱を導く可能性がある短い失われたアラビア語ASRへの挑戦を導入する可能性がある。このあいまいさのため,ASRシステムの最も重要な成分の一つであることを最適以下の音響モデルを作成した。本論文では,diacritizedと非diacritizedテキストを用いて性能を示した。実験では,Carnegie Mellon大学(CMU)PocketSphinx音声認識器を用いた。も訓練のための13.5時間と試験のための4.1時間を含む新しい「住宅」現代標準アラビア語(MSA)連続音声コーパスを用いた。コーパスのテキストた手動diacritized音響モデリングのために,音声tied-mixture(PTM)を使用した。実験結果は,非diacritizedテキストシステムは76.4%(すなわち1単語誤り率(WER))をスコア化しdiacritizedテキストベースシステムは63.8%を記録した。diacritized症例は付加記号のわずかな違いによる精度が少ないもことを示した;が,非diacritized症例は適切でアラビア語母語話者用の無欠陥である可能性がある。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】