Proj
J-GLOBAL ID:202104001755044254
Research Project code:11101438
未知語と認識誤りに頑健な音声ドキュメントの高速・高精度ターム検索手法の開発
未知語と認識誤りに頑健な音声ドキュメントの高速・高精度ターム検索手法の開発
Study period:2011 - 2011
Organization (1):
Research responsibility:
(
, 工学(系)研究科(研究院), 教授 )
Research overview:
インターネット上には、放送、講演・講義、ポッドキャストなどの大量の音声ドキュメントが蓄積・配信されている。これらには、タイトル等は記載されているが、音声コンテンツの記載はなく、音声波形情報だけであることが多い。このような大量の音声ドキュメントから、所望の語句を含んでいる箇所の音声を高速・高精度に検索することが望まれている。本研究では、大語彙連続音声認識技術と連続音節音声認識技術を併用して、認識誤りや未知語(認識システムの単語辞書に登録されていない単語)に頑健な検索手法を開発した。1000時間の音声に対して、未知語(検索ターム語)を0.5秒以内で、F値で0.6程度の精度で検索することができた。
Terms in the title (7):
Terms in the title
Keywords automatically extracted from the title.
,
,
,
,
,
,
Research program:
>
>
>
Organization with control over the research:
Japan Science and Technology Agency
Return to Previous Page