プレプリント
J-GLOBAL ID:202202206158200726   整理番号:22P0327850

神経埋込みによる音声疲労の検出【JST・京大機械翻訳】

Detecting Vocal Fatigue with Neural Embeddings
著者 (5件):
資料名:
発行年: 2022年04月07日  プレプリントサーバーでの情報更新日: 2023年01月17日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Vocal疲労は,拡張利用により,音声の感性感と虚弱感を指す。本論文では,声帯疲労の検出に対する神経埋込みの有効性を検討した。学術的発話英語のコーパス上で,xベクトル,ECAPA-TDNN,およびwav2vec2.0埋込みを比較した。データの低次元マッピングは,神経埋込みが,長時間の音声使用中の話者の音声特性における変化に関する情報を捉えることを明らかにする。時間平滑化と正規化を抽出埋込みに適用するとき,連続発話の50分後に,すべての3種類のニューラル埋込みを用いて音声疲労を確実に予測できることを示した。分類のためにサポートベクトルマシンを採用し,xベクトルを用いて81%の精度スコア,ECAPA-TDNN埋込みを用いて85%,および入力特徴としてwav2vec2.0埋込みを用いて82%を達成した。訓練されたシステムが適応なしに異なる話者と記録環境に適用されるとき,76%の精度スコアを得た。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る