フィラー語検出と分類:データセットとベンチマーク【JST・京大機械翻訳】

Zhu Ge; Caceres Juan-Pablo; Salamon Justin

プレプリント

J-GLOBAL ID：202202203217440680 整理番号：22P0311785

フィラー語検出と分類:データセットとベンチマーク【JST・京大機械翻訳】

Filler Word Detection and Classification: A Dataset and Benchmark

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年03月28日プレプリントサーバーでの情報更新日： 2022年07月01日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

「uや「μmのようなフレア語は,音や単語の人々が,彼らを話すために利用している。記録からのフィラー単語の発見は,メディア編集における一般的で退屈なタスクである。フィラー単語の自動検出と分類は,この課題で大いに助けることができるが,今日までこの問題に関する研究はほとんどない。重要な理由は,モデル訓練と評価のための注釈付きフィラー単語によるデータセットの欠如である。本研究では,35K注釈付きフィラー語と50K注釈付きのポッドキャスト(例えば,呼気, lter,および単語反復)で一般に発生する,新しい音声データセット,PodcastFillerを提案した。フィラー候補と分類器がフィラー単語タイプを区別するために,VADとASRを利用するパイプラインを提案した。著者らは,PodastFillerの提案パイプラインを評価し,いくつかのベースラインと比較し,詳細なアブレーション研究を提示した。特に,ASRの使用の重要性と,キーワードスポッティングに似た転写フリーアプローチと比較する方法を評価する。このパイプラインは最先端の結果を得て,ASRのレバージングはキーワードスポッティング手法よりも性能的に優れていることを示した。将来の研究のベンチマークとして役立つことを期待して,PodastFillerを公的に利用可能な。【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , 【Automatic Indexing@JST】

自然語処理 , パターン認識 , 音声処理

, , ,

前のページに戻る