特許
J-GLOBAL ID:200903092202844097

音声区間検出方式

発明者:
出願人/特許権者:
代理人 (1件): 内原 晋
公報種別:公開公報
出願番号(国際出願番号):特願平3-226734
公開番号(公開出願番号):特開平5-066787
出願日: 1991年09月06日
公開日(公表日): 1993年03月19日
要約:
【要約】【構成】正確に音声区間を切り出した少数の音声パタンの前後に数単位時間当たりの雑音データを加えた音声パタンを標準パタンとし、音声と雑音とを区別するしきい値を用いて予備的に音声区間を切り出した音声データを学習パタンとし、標準パタンと学習パタンとでマッチングを行ない、マッチングの結果から標準パタンの音声区間の始端に対応する部分を学習パタンの始端とし、標準パタンの終端に対応する部分を学習パタンの終端として求める。【効果】従来のしきい値による音声区間検出方法より正確に音声区間を検出することができる。
請求項(抜粋):
正確に音声区間を切り出した音声パタンの前後に雑音パタンを加えた音声パタンを標準パタンとし、音声区間検出をする音声データを学習パタンとし、前記標準パタンと前記学習パタンとでマッチングを行ない、このマッチングの結果から前記標準パタン中の前記音声パタンの始端に対応する部分を前記学習パタンの始端と定め、前記標準パタン中の前記音声パタンの終端に対応する部分を前記学習パタンの終端と定めることを特徴とする音声区間検出方式。
IPC (4件):
G10L 3/00 513 ,  G10L 3/00 521 ,  G10L 3/00 ,  G10L 3/00 533

前のページに戻る