特許
J-GLOBAL ID:200903073488165626
音声処理装置、音声処理方法、音声処理プログラム、および、プログラム記録媒体
発明者:
出願人/特許権者:
代理人 (3件):
山崎 宏
, 前田 厚司
, 仲倉 幸典
公報種別:公開公報
出願番号(国際出願番号):特願2003-118305
公開番号(公開出願番号):特開2004-325635
出願日: 2003年04月23日
公開日(公表日): 2004年11月18日
要約:
【課題】誤認識となる要因を判定して利用者に通知する。【解決手段】セグメント分割部14は、特徴抽出部13で抽出された入力音声の特徴量を、標準モデル格納部18に格納された標準モデルとの比較によって音素毎のセグメントに分割する。要因分析部15は、各セグメント毎の特徴量に基づいて複数の誤認識の要因に関する特徴量を求め、各要因の特徴量の標準モデルからのずれの度合いを算出し、最もずれの大きい要因を検出する。メッセージ作成部16およびメッセージ提示部17は、上記最もずれの大きい要因をメッセージによって使用者に提示する。こうして、利用者に、誤認識となる要因を、人間が直感的に理解し易い要因によって知らせることができ、利用者の不快感を減らすことができる。【選択図】 図2
請求項(抜粋):
入力された音声の特徴量と標準モデルとの比較を行う音声処理装置であって、
上記入力された音声の特徴量に基づいて複数の誤認識の要因に関する特徴量を求め、各要因毎に上記特徴量の上記標準モデルからのずれの度合いを算出する要因別ずれ算出手段と、
上記算出されたずれの度合いが許容範囲を表す閾値内にあるか否かを判定すると共に、上記閾値内にある場合には、上記ずれの度合いを上記許容範囲内にあることを表す所定値に変換するずれ度合変換手段と、
上記算出されたずれの度合いと上記変換されたずれの度合いとに基づいて、最もずれの度合いが大きい要因を検出する要因検出手段と、
上記検出された最もずれの大きい要因を誤認識となる要因として出力する誤認識要因出力手段
を備えたことを特徴とする音声処理装置。
IPC (4件):
G10L15/28
, G10L15/10
, G10L15/20
, G10L15/22
FI (5件):
G10L3/00 571H
, G10L3/00 531P
, G10L3/00 531F
, G10L3/00 561B
, G10L3/00 561C
Fターム (6件):
5D015AA01
, 5D015BB02
, 5D015KK03
, 5D015LL03
, 5D015LL04
, 5D015LL05
前のページに戻る