文献
J-GLOBAL ID:202102260550295855   整理番号:21A3307575

オーディオからの顔マスク認識:MASCデータベースとマスク挑戦に関する概観【JST・京大機械翻訳】

Face mask recognition from audio: The MASC database and an overview on the mask challenge
著者 (16件):
資料名:
巻: 122  ページ: Null  発行年: 2022年 
JST資料番号: D0611A  ISSN: 0031-3203  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
COVID-19の突然発生は,物理的接触によるその広がりと表面マスクの着用の規制により,バイオメトリックの分野に対する困難な課題をもたらした。これらの制約を考えると,音声バイオメトリックは適切な非接触バイオメトリックソリューションを提供できる。それらは,話者がマスクを着用するかどうかを分類するモデルから利益を得ることができる。本論文では,話者のオーディオチャンクがマスクを着用するか否かを分類する,話者のオーディオチャンクを与えられた,以下の分類タスクに焦点を当てた,INTERSPEECH 2020 COMputational PARalinguistics challengE(ComParE)のMask Sub-Challenge(MSC)をレビューした。第1に,Mask Augsburg Speech Corpus(MASC)の収集と,その問題を解決するためのベースライン手法を報告し,71.8%の非加重平均Recall(UAR)の性能を達成した。次に,2つの共通パターンを用いて,提出されたおよび受け入れられた論文で調査された方法論を要約した。(i)音声ベースオーディオ特徴,または(ii)画像処理で通常用いられる畳込みニューラルネットワーク(CNN)と結合したオーディオのスペクトログラム表現。ほとんどの手法は,異なるモデルのアンサンブルを適応させ,様々な技術を用いて訓練データのサイズを増加させることを試みることにより,それらのモデルを強化する。勝者が80.1%のUARをスコアリングするこのサブチャレンジの参加者の結果をレビューし,議論する。さらに,この方法を融合する結果を示し,UARは82.6%であった。最後に,ユーザが顔マスクを着用するかどうかを実時間で検出する概念実証の証明として使えるスマートフォンアプリケーションを提示する。また,最良モデルの実行時間をベンチマークした。Copyright 2021 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る