文献
J-GLOBAL ID:202202211394506750   整理番号:22A0437793

一次元畳込みニューラルネットワークを用いた音声障害の分類【JST・京大機械翻訳】

Classification of Voice Disorders Using a One-Dimensional Convolutional Neural Network
著者 (7件):
資料名:
巻: 36  号:ページ: 15-20  発行年: 2022年 
JST資料番号: W3399A  ISSN: 0892-1997  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
聴覚知覚音声分析は,病理学的音声品質を定量化するための標準的な方法であるが,知覚評価は主観的評価に基づいており,従って,検査者の間で変化する可能性がある。多くの音響計量が病理学的音声の客観的評価における潜在的使用のために研究されているが,個々の症例における音響計量の解釈は困難であり,技術は臨床医によって広く使用されていない。本研究の目的は,1次元畳み込みニューラルネットワーク(1D-CNN)モデルを用いて,病理学的音声のグレード,粗さ,呼吸性,無力症,歪(GRBAS)スケールスコアを識別するための標準化方法を確立することであった。母音/a/a/の持続的発声の1,377の音声サンプルを利用したオリジナルデータセットを構築した。各音声サンプルをGRBASスケールに従って3人の専門家によって評価し,中央値を正しい回答ラベルとして使用した。9,600試料のフレーム幅を持つ生音声波形入力を持つエンドツーエンド1D-CNNモデルを設計した。モデルを各GRBASカテゴリに対して著者らのオリジナルデータセットで訓練し,モデル性能を5倍交差検証法により試験した。試験データセットのための精度,F1スコア,および二次加重Cohenのカッパを決定した。Gスケールに対するメトリックスは,高精度(0.771)と実質的な一致(κ=0.710)で,最もバランスの高いモデル性能を示した。Rスケールに対するモデルは,中程度の一致(κ=0.536)で比較的高い精度(0.765)とF1スコア(0.743)を有した。Sスケールに対する精度(0.883)とF1スコア(0.865)は5つのカテゴリーの中で最も高く,一方,Cohenのカッパは最低(0.190)であった。エンドツーエンド1D-CNNモデルは,ヒト評価に匹敵する信頼性で全体的病理学的音声品質を評価することができる。機械学習モデルが訓練され,評価できる効率は,データセット品質に密接に関連している。Copyright 2022 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  聴覚・音声モデル 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る