Proj
J-GLOBAL ID:202104000590312511  Research Project code:12102351

音声入力による音声ドキュメントの高速・高精度なターム検索手法の開発

音声入力による音声ドキュメントの高速・高精度なターム検索手法の開発
Study period:2012 - 2013
Organization (1):
Research responsibility: ( , 工学(系)研究科(研究院), 教授 )
Research overview:
講義音声や講演音声、放送コンテンツ、コールセンターの収録音、インターネット上のポッドキャストなど膨大な音声データ(音声ドキュメントと呼ぶ)が蓄積されている。このような音声データから、所望のキーワードを含む音声区間を高速に検索することが望まれている。従来の研究は、これらのキーワードをキーボード等のテキストで入力するのが一般的であった。本研究開発では、キーワードを音声で入力する手法を開発した。 高速に検索するためには、音声データを音声認識装置で一旦音節列等の文字列に変換語、文字列同士のDPマッチング法を適用するのが一般的であるが、時間処理量が大きい問題があった。本研究開発では、音声認識誤りを考慮した音節単位のトライグラムのインデックス化により、DPマッチングの性能を上回り、かつ16倍高速な検索法を開発した。
Research program:
Organization with control over the research:
Japan Science and Technology Agency

Return to Previous Page