Proj
J-GLOBAL ID:202104009960710039  Research Project code:12102826

ウェブ発話を対象とした子ども話者識別法における聴覚特性の導入

ウェブ発話を対象とした子ども話者識別法における聴覚特性の導入
Study period:2012 - 2013
Organization (1):
Research responsibility: ( , システム工学部, 助教 )
Research overview:
音声を入力とする大人・子ども識別手法を応用システムに展開する為の開発を行った。「圧縮型ガンマチャープ聴覚フィルタによる寸法・形状知覚理論」により抽出した特徴量に変調スペクトル成分を付与し、識別器に深層学習のニューラルネットワークを導入した。実環境を再現した実験において5.7%の精度向上を確認した。加えて、Bag-of-Wordsの言語情報を素性とする識別器を検討した。提案法の応用にはプログラムの高速化が必要である。アルゴリズム・実装方法の見直しによって5倍の高速化を実現した。HTML5を用いて音声ウェブシステムを再構成し、タブレットPCやスマートホン等の各種環境で安定動作するデモシステムを実装した。
Terms in the title (5):
Terms in the title
Keywords automatically extracted from the title.
Research program:
Organization with control over the research:
Japan Science and Technology Agency

Return to Previous Page