特許
J-GLOBAL ID:200903001899509457

音声データ圧縮及び再生の方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 合田 潔 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-288003
公開番号(公開出願番号):特開平6-230800
出願日: 1993年11月17日
公開日(公表日): 1994年08月19日
要約:
【要約】【目的】 人間の音声の圧縮されたデータ表現を作り、それを用いてその人間の音声を正確に再生できる方法及びシステム。【構成】 先ず、音声に含まれるサイレンス、有声音及び無声音のそれぞれの発生が検知される。次に、各有声音を近似するために繰返し用いられる1つの代表的データフレームが、各有声音の持続期間と共に反復的に決定される。各無声音のスペクトル内容もまた、その振幅変化と共に決定される。その後、各サイレンス期間の持続時間、各有声音の持続時間と1つの代表的データフレーム、及び各無声音のスペクトル内容と振幅変化に対するコード化された表現を含む圧縮されたデータ表現が作られる。後に、この圧縮されたデータ表現は、明瞭さを損なうことなくその音声を再生するために用いることができる。
請求項(抜粋):
有声音及び無声音を含む人間の音声の圧縮されたデータ表現を作る方法であって、前記人間の音声に含まれる各有声音の発生を検知するステップと、前記各有声音の持続時間、及び繰返し適用されたとき最もよく前記有声音を近似する1つの代表的データフレームを決定するために前記各有声音を解析するステップと、前記人間の音声に含まれる各無声音の発生を検知するステップと、前記各無声音のスペクトル内容及び振幅変化を決定するために前記各無声音を解析するステップと、前記各有声音の持続時間及び1つの代表的データフレームのコード化された表現、並びに前記各無声音のスペクトル内容及び振幅変化のコード化された表現を含む前記人間の音声の圧縮されたデータ表現を作るステップとを含む、人間の音声の圧縮されたデータ表現を作る方法。
引用特許:
審査官引用 (2件)
  • 特開平2-058100
  • 特開昭64-076100

前のページに戻る