特許
J-GLOBAL ID:200903030622674108

音声処理装置及び音声データ検索装置

発明者:
出願人/特許権者:
代理人 (1件): 澤田 俊夫
公報種別:公開公報
出願番号(国際出願番号):特願平11-058295
公開番号(公開出願番号):特開2000-259645
出願日: 1999年03月05日
公開日(公表日): 2000年09月22日
要約:
【要約】【課題】 音声データに含まれる音素や音節・単語などの出現尤度を的確に計算して、出現尤度に基づいて音声データの検索を正確且つ確実に行なう。【解決手段】 音声データ検索装置は、複数の音声データからなる音声データベースから音素や音節・単語等の出現尤度を計算して保管しておく出現尤度保管部と、検索要求の入力を受けるクエリ入力部と、クエリを音素や音節・単語等の列に変換するクエリ変換部と、前記変換されたクエリを保管するクエリ保管部と、前記クエリ保管部のクエリと前記出現尤度保管部の出現尤度を照合して両者の一致度を計算する照合部を備えている。音声認識結果を有向グラフ型のデータ構造で表現することによって、多くの認識結果候補を保持して検索誤りの可能性を低減することができる。また、検索対象となる音声データの音声認識結果を音素や音節などの単語以下の単位で保持することによって、音声入力されたクエリを音素や音節に展開して、検索対象の音素や音節と照合することで、クエリに未登録語が含まれている場合でも適切な検索処理を行うことができる。
請求項(抜粋):
音声を認識して音素や音節・単語等を単位とする有向グラフ型のデータ構造を作成し、このデータ構造を基に、音声の中に含まれる音素や音節・単語等の列の出現尤度を計算することを特徴とする音声処理装置。
IPC (3件):
G06F 17/30 ,  G10L 15/00 ,  G10L 15/28
FI (4件):
G06F 15/40 370 E ,  G10L 3/00 551 P ,  G10L 3/00 571 F ,  G06F 15/403 340 B
Fターム (15件):
5B075ND14 ,  5B075PP07 ,  5B075PQ46 ,  5B075PQ74 ,  5B075PR04 ,  5B075PR06 ,  5B075QM08 ,  5D015KK03 ,  5D015LL08 ,  9A001BB06 ,  9A001GG01 ,  9A001HH15 ,  9A001HH17 ,  9A001JJ01 ,  9A001JJ07

前のページに戻る