特許
J-GLOBAL ID:201003074973172360

音声認識装置及び音声変換装置

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人三枝国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2009-068545
公開番号(公開出願番号):特開2010-224020
出願日: 2009年03月19日
公開日(公表日): 2010年10月07日
要約:
【課題】高速で音声認識を行うことができる音声認識装置を提供する。【解決手段】音声波形信号をフレーム単位で解析して音声の特徴量を表す特徴ベクトルを抽出する特徴ベクトル抽出部231と、特徴ベクトルを時系列的に複数フレーム分記憶する特徴ベクトル記憶部232と、音声認識候補となる複数の音声を記憶する認識候補音声記憶部233と、特徴ベクトル記憶部に記憶された複数フレーム分における特徴ベクトルに基づき音声認識候補となる各音声の尤度を算出する第1解析部234と、複数フレーム分における特徴ベクトルからフレーム単位あたりの平均特徴ベクトルを算出し当該平均特徴ベクトルから音声認識候補となる音声の尤度を算出する第2解析部235と、第1解析部において算出した音声認識候補となる各音声の尤度及び第2解析部において算出した音声認識候補となる各音声の尤度に基づき一つの音声を決定する音声決定部236とを備える音声認識装置。【選択図】図1
請求項(抜粋):
音声を入力する音声入力手段と、前記音声入力手段に入力された音声信号をデジタル音声波形信号に変換する変換手段と、前記変換手段で変換されたデジタル音声波形信号から、前記音声入力手段に入力された音声を解析する解析手段とを備える音声認識装置であって、 前記解析手段は、 前記デジタル音声波形信号をフレーム単位で解析して音声の特徴量を表す特徴ベクトルを抽出する特徴ベクトル抽出部と、 前記フレーム単位で抽出した前記特徴ベクトルを時系列的に複数フレーム分記憶する特徴ベクトル記憶部と、 音声認識候補となる複数の音声を記憶する認識候補音声記憶部と、 前記特徴ベクトル記憶部に記憶された複数フレーム分における前記特徴ベクトルに基づいて、音声認識候補となる各音声の尤度を算出する第1解析部と、 前記複数フレーム分における前記特徴ベクトルからフレーム単位あたりの平均特徴ベクトルを算出し、当該平均特徴ベクトルから、音声認識候補となる音声の尤度を算出する第2解析部と、 前記第1解析部において算出した音声認識候補となる各音声の尤度、及び、前記第2解析部において算出した音声認識候補となる各音声の尤度に基づいて一つの音声を決定する音声決定部と、を備える音声認識装置。
IPC (6件):
G10L 15/28 ,  G10L 15/16 ,  G10L 15/14 ,  G10L 15/10 ,  G10L 15/18 ,  G10L 15/22
FI (6件):
G10L15/28 360A ,  G10L15/16 ,  G10L15/14 200B ,  G10L15/10 300G ,  G10L15/18 300H ,  G10L15/22 460D
Fターム (4件):
5D015BB02 ,  5D015HH05 ,  5D015HH15 ,  5D015KK04
引用特許:
出願人引用 (2件)

前のページに戻る