特許
J-GLOBAL ID:200903045254005532

音声認識方法、この方法を実施する装置、プログラムおよび記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 草野 卓 ,  稲垣 稔
公報種別:公開公報
出願番号(国際出願番号):特願2004-259584
公開番号(公開出願番号):特開2005-275348
出願日: 2004年09月07日
公開日(公表日): 2005年10月06日
要約:
【課題】 単語系列における言語的妥当性を情報として使用して音声認識結果に対して精度の高い認識結果の信頼度を付与する音声認識方法、装置、プログラム、記録媒体。【解決手段】入力される音声信号から抽出した音響特徴パラメータに対して、言語的単位の各カテゴリの特徴を表現した確率モデルの出力する確率に基づくスコアを計算し、最も高いスコアを示すモデルが表現するカテゴリを認識結果とし、認識結果と共にその認識結果の信頼度を出力する音声認識装置において、音声認識部1と、音声認識部1から得られた認識結果の単語系列における各単語について、その単語を含む連続する複数の単語の系列における言語的妥当性の評価を行い、信頼度を付与する信頼度付与部3と、信頼度付与部3で求めた信頼度と音声認識結果とを出カさせる信頼度付認識結果出力部4とを有し、音声認識結果の言語的妥当性に基づいて信頼度を求める音声認識装置。【選択図】 図1
請求項(抜粋):
入力される音声信号をディジタル信号に変換し、そのディジタル信号から音響特徴パラメータを抽出し、その抽出した音響特徴パラメータに対して、与えられた言語的制約のもとで、言語的単位の各カテゴリの特徴を表現した確率モデルの出力する確率に基づくスコアを計算し、最も高いスコアを示すモデルが表現するカテゴリを認識結果とし、認識結果と共にその認識結果の信頼度を出力する音声認識方法において、 入力された音声を認識して認識結果として単語系列を得る音声認識ステップと、 音声認識ステップから得られた認識結果である1或いは複数の先行語および/或いは後続語の単語系列における各単語について、その単語を含む連続する複数の単語の系列における言語的妥当性の評価を行い、信頼度を付与する信頼度付与ステップと、 信頼度付与ステップで求めた信頼度と音声認識結果とを出力させる信頼度付認識結果出力ステップとを有し、 音声認識結果の言語的妥当性に基づいて信頼度を求めることを特徴とする音声認識方法。
IPC (1件):
G10L15/18
FI (3件):
G10L3/00 537A ,  G10L3/00 537G ,  G10L3/00 537Z
Fターム (1件):
5D015HH23
引用特許:
出願人引用 (1件) 審査官引用 (5件)
全件表示

前のページに戻る