自動音声認識のためのサブワードモデリング-過去,現在,最新の手法

LIVESCU Karen; FOSLER-LUSSIER Eric; METZE Florian

文献

J-GLOBAL ID：201202242168384131 整理番号：12A1634851

自動音声認識のためのサブワードモデリング-過去,現在,最新の手法

Subword Modeling for Automatic Speech Recognition

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=12A1634851&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=12A1634851&from=J-GLOBAL&jstjournalNo=H0928A") }}

著者 (3件)： , ,
資料名：
巻： 29 号： 6 ページ： 44-57 発行年： 2012年11月
JST資料番号： H0928A ISSN： 1053-5888 CODEN： ISPRE6 資料種別：逐次刊行物 (A)
記事区分：文献レビュー発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

多くの自動音声認識システムは大量の語彙を処理するため,各語を十分集めて個別のワードモデルを訓練することは不可能である。そのため,大規模語彙認識では各語をサブワード単位で表現している。典型的なサブワード単位は,子音や母音などの音節であり,各語は音節の音列として表現される。サブワード単位の選択とこれらの単位の組合せとして単語を表現する方法は,サブワードモデリングの中心課題である。ここではこのサブワードモデリングの過去,現在,今後出てくる手法をレビューした。従来の音節ベースのモデルから音響ユニットや音素片特徴を用いたモデルまでについて述べた。グラフィカルモデルの統一的表現を通して,これら手法の共通性と違いを示した。どのモデルが優れているかは結論できず,サブワードモデリングは依然として今後の研究テーマである。1990年後半から2000前半に大いに研究された,音節辞書を拡張する考えは,サブワードモデルの成功には至らなかった。その理由は,発音変動の連続性であった。音響レベルでの変動をモデル化する代替方法も音節辞書拡張と同程度であった。中間的なものもいくつか提案されたが,コンテキストをモデリングする方法は重要である。条件付または識別的モデリングはサブワードモデリング研究で注目を浴びており,性能を大いに向上させる可能性を秘めている。また,サブワードモデリング,観測モデリング,機械学習技術を組み合わせた方法の研究が最近始まっている。識別的シーケンスモデルの新たな研究もより強い構造を取り入れることを可能にしている。

, , , , ,
,

パターン認識

前のページに戻る