特許
J-GLOBAL ID:200903039276599045
音韻抽出装置、方法及びプログラムを記憶した記憶媒体
発明者:
出願人/特許権者:
代理人 (1件):
丸山 隆夫
公報種別:公開公報
出願番号(国際出願番号):特願平11-112770
公開番号(公開出願番号):特開2000-305593
出願日: 1999年04月20日
公開日(公表日): 2000年11月02日
要約:
【要約】【課題】 入力音声信号から音韻を精度良く抽出する。【解決手段】 分析部1は、入力音声信号を分析して音声特徴パラメータを求める。単語モデル生成部2は、入力されたテキストから必要な音素HMMを音素モデル記憶部7から抽出し、単語HMMを生成する。認識処理部3は、上記音声特徴パラメータと単語HMMとの間の最適経路を求め、最適経路に基づいて音素間の境界と音素毎の尤度、時間長を求める。正規化部4は、尤度、時間長を正規化する。閾値判定部5は、各音素毎にその尤度、時間長と前後の音素の尤度、時間長を閾値記憶部8に記憶された閾値と比較する。閾値の範囲内であれば、音素抽出部6で、その音素を上記入力音声信号から切り出して出力する。
請求項(抜粋):
入力音声信号を分析し音声特徴パラメータを生成する分析手段と、音韻モデルを記憶する音素モデル記憶手段と、前記入力音声信号の発声内容を表す入力テキストに基づいて前記記憶された音韻モデルを連結して単語モデルを生成する単語モデル生成手段と、前記音声特徴パラメータと前記単語モデルとから各音韻の境界及び前記音韻モデルに対する適合度を求める認識処理手段と、予め定められた音韻の適合度の閾値を記憶する閾値記憶手段と、前記認識処理手段で求めた適合度を前記記憶された閾値と比較し、該閾値を超える音韻の境界のみを検出する閾値判定手段と、前記入力音声信号から、前記閾値判定手段で検出された境界で音韻を抽出する音素抽出手段とを設けたことを特徴とする音韻抽出装置。
IPC (2件):
FI (2件):
G10L 3/00 535 A
, G10L 3/00 531 F
Fターム (9件):
5D015BB02
, 5D015HH11
, 5D015HH23
, 9A001BB03
, 9A001GG01
, 9A001GG05
, 9A001HH16
, 9A001HH17
, 9A001KK37
引用特許:
審査官引用 (5件)
-
音素ラベリング装置
公報種別:公開公報
出願番号:特願平5-075073
出願人:エヌ・ティ・ティ・データ通信株式会社
-
音声認識システムにおける音素分類方法
公報種別:公開公報
出願番号:特願平6-080804
出願人:株式会社明電舎
-
特開平2-089098
-
韻律境界の自動的ラベリング法
公報種別:公開公報
出願番号:特願平5-171504
出願人:株式会社エイ・ティ・アール自動翻訳電話研究所
-
特開昭60-075893
全件表示
前のページに戻る