特許
J-GLOBAL ID:200903078192626590

音声データ処理装置

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦
公報種別:公開公報
出願番号(国際出願番号):特願平6-296714
公開番号(公開出願番号):特開平8-153118
出願日: 1994年11月30日
公開日(公表日): 1996年06月11日
要約:
【要約】【目的】取扱者の必要とする音声データを容易かつ効率的に音声データを検索し再生することを可能とする音声データ処理装置を提供する。【構成】音声データを入力する入力部3と、この入力された音声データをセンテンス単位に分割する分割部4と、このセンテンス単位に分割された音声データそれぞれの時間情報を取得し、上記センテンス単位に分割された音声データそれぞれから話者を識別するためのパラメータを抽出し、上記抽出されたパラメータを所定の許容範囲内でグループ化し、このグループそれぞれに話者識別情報を割り振る解析部5と、上記センテンス単位に分割された音声データそれぞれを上記時間情報及び話者識別情報を含む所定の属性情報を付加して格納する格納部6とを具備し、入力した音声データを解析して音声データベース10を構築することを特徴とする。
請求項(抜粋):
音声データを入力する手段と、この入力された音声データをセンテンス単位に分割する手段と、このセンテンス単位に分割された音声データそれぞれの時間情報を取得する手段と、上記センテンス単位に分割された音声データそれぞれから話者を識別するためのパラメータを抽出する手段と、上記抽出されたパラメータを所定の許容範囲内でグループ化し、このグループそれぞれに話者識別情報を割り振る手段と、上記センテンス単位に分割された音声データそれぞれを上記時間情報及び話者識別情報を含む所定の属性情報を付加して格納する手段とを具備し、入力した音声データを解析して音声データベースを構築することを特徴とする音声データ処理装置。
IPC (4件):
G06F 17/30 ,  G10L 3/00 521 ,  G10L 3/00 531 ,  G10L 3/00 561

前のページに戻る