文献
J-GLOBAL ID:202302279356750421   整理番号:23A0023761

深層ブラインド音源分離と転移学習に基づく遠隔音声認識の評価

著者 (6件):
資料名:
巻: 2022  号: Challenge-061  ページ: 47-50(J-STAGE)  発行年: 2022年11月22日 
JST資料番号: U2752A  ISSN: 2436-5556  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,深層ブラインド音源分離と転移学習に基づく遠隔音声認識について述べる.複数話者による同時発話の遠隔音声認識には,混合音から各話者の音声を抽出する音源分離が不可欠である.複数話者の遠隔音声認識では,発話区間情報と深層生成モデルを用いた弱教師あり深層ブラインド音源分離が高い性能を発揮することが知られている.しかしこの手法は,混合音を時間周波数クラスタリングした結果を補助特徴量として用いるため,特徴量の計算に時間を要する課題があった.本研究では,より簡便な特徴量で頑健に動作する枠組みの確立を目指す.具体的には,学習データに対するクラスタリング結果を疑似教師として深層生成モデルを事前学習し,学習済みモデルを初期値として深層ブラインド音源分離に転移する.ディナーパーティの遠隔音声認識(CHiME-6Challenge)の単語誤り率を評価することで,提案法の有効性を検証した.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  音響信号処理 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る