抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
我々は,従来から音節単位音響モデリングについて研究を行っている。そこで本研究では,まず音節単位および音素単位DNN-HMMを構築し,これらの認識精度について調査を行った。その結果,triphone,コンテキスト独立音節いずれもほぼ等しい認識精度を示した。次に,3つの年齢層(成人・老人・子供)と性別(男性・女性)ごとに計6つのクラスの学習データを用意し,年齢・性別に依存しないDNN-HMMの検討を行った。一般的に,不特定話者を対象とした音声認識システムは,話者特定システムに比べ,認識性能が低下してしまう。しかしクラス毎に特徴量を正規化することで,すべてのクラスを用いて一つのモデルを学習した場合でも,クラスごとにDNN-HMMを学習したモデルを上回る認識精度を得ることが出来た。最後に,クラス情報のネットワークへの組み込みを検討した。(著者抄録)