研課題
J-GLOBAL ID:202104001755044254  研究課題コード:11101438

未知語と認識誤りに頑健な音声ドキュメントの高速・高精度ターム検索手法の開発

実施期間:2011 - 2011
実施機関 (1件):
研究責任者: ( , 工学(系)研究科(研究院), 教授 )
研究概要:
インターネット上には、放送、講演・講義、ポッドキャストなどの大量の音声ドキュメントが蓄積・配信されている。これらには、タイトル等は記載されているが、音声コンテンツの記載はなく、音声波形情報だけであることが多い。このような大量の音声ドキュメントから、所望の語句を含んでいる箇所の音声を高速・高精度に検索することが望まれている。本研究では、大語彙連続音声認識技術と連続音節音声認識技術を併用して、認識誤りや未知語(認識システムの単語辞書に登録されていない単語)に頑健な検索手法を開発した。1000時間の音声に対して、未知語(検索ターム語)を0.5秒以内で、F値で0.6程度の精度で検索することができた。
研究制度:
研究所管機関:
国立研究開発法人科学技術振興機構

前のページに戻る