抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多くの自動音声認識システムは大量の語彙を処理するため,各語を十分集めて個別のワードモデルを訓練することは不可能である。そのため,大規模語彙認識では各語をサブワード単位で表現している。典型的なサブワード単位は,子音や母音などの音節であり,各語は音節の音列として表現される。サブワード単位の選択とこれらの単位の組合せとして単語を表現する方法は,サブワードモデリングの中心課題である。ここではこのサブワードモデリングの過去,現在,今後出てくる手法をレビューした。従来の音節ベースのモデルから音響ユニットや音素片特徴を用いたモデルまでについて述べた。グラフィカルモデルの統一的表現を通して,これら手法の共通性と違いを示した。どのモデルが優れているかは結論できず,サブワードモデリングは依然として今後の研究テーマである。1990年後半から2000前半に大いに研究された,音節辞書を拡張する考えは,サブワードモデルの成功には至らなかった。その理由は,発音変動の連続性であった。音響レベルでの変動をモデル化する代替方法も音節辞書拡張と同程度であった。中間的なものもいくつか提案されたが,コンテキストをモデリングする方法は重要である。条件付または識別的モデリングはサブワードモデリング研究で注目を浴びており,性能を大いに向上させる可能性を秘めている。また,サブワードモデリング,観測モデリング,機械学習技術を組み合わせた方法の研究が最近始まっている。識別的シーケンスモデルの新たな研究もより強い構造を取り入れることを可能にしている。