抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・End-to-End音声認識システムの枠組みを用いて,複数言語の音声認識におけるマルチタスク学習について提案。
・CTCをベースとしたEnd-to-End音声認識システムに言語識別器,話者識別器,発話スタイル識別器を組み合わせたマルチタスク学習を行い,評価。
・対象言語として,チェコ語,英語,フランス語,ドイツ語,日本語,スペイン語を扱い,各言語の学習データを約30時間以内に制限し,少ないデータ量でも音声認識が可能であること実証。
・CTCの事前学習モデルの認識性能をマルチタスク学習モデルが上回り,補助タスク部分にGRL(Gradient Reversal Layer)を適用することにより,認識性能の改善を確認。
・マルチタスク学習モデルがベースラインであるDNN-HMM音声認識システムの認識性能に匹敵し,複数言語の音声認識において,マルチタスク学習モデルが有効であることを確認。