特許
J-GLOBAL ID:201703005636381187

音声認識装置および音声認識方法

発明者:
出願人/特許権者:
代理人 (6件): 田澤 英昭 ,  濱田 初音 ,  中島 成 ,  河村 秀央 ,  坂元 辰哉 ,  辻岡 将昭
公報種別:再公表公報
出願番号(国際出願番号):JP2013081287
公開番号(公開出願番号):WO2015-075789
出願日: 2013年11月20日
公開日(公表日): 2015年05月28日
要約:
音声取得部1は、ユーザが自由に発話した原音声を取得する。音声データ加工部7は、原音声信号を加工して加工音声信号を生成する。音響モデル切換部4は、音声認識部5が各言語の音響モデル3-1〜3-xを用いて加工音声信号の音響特徴の時系列データを認識処理して算出した言語ごとの認識スコアに基づいて、複数の音響モデル3-1〜3-xの中から1つの音響モデルを決定する。
請求項(抜粋):
音声を取得して原音声信号として出力する音声取得部と、 前記原音声信号を加工して加工音声信号を生成する音声データ加工部と、 前記原音声信号および前記加工音声信号を分析して音響特徴の時系列データを生成する音響分析部と、 認識対象とする複数の言語に対応した複数の音響モデルと、 各言語の前記音響モデルを用いて、前記原音声信号の音響特徴の時系列データを各言語の音声ラベル列に変換し各言語の判定用辞書を生成すると共に、各言語の前記音響モデルと前記判定用辞書とを用いて、前記加工音声信号の音響特徴の時系列データを認識処理し言語ごとに認識スコアを算出する音声認識部と、 前記音声認識部が算出した前記言語ごとの認識スコアに基づいて、複数の前記音響モデルの中から一の音響モデルを決定する音響モデル切換部とを備える音声認識装置。
IPC (3件):
G10L 15/06 ,  G10L 15/20 ,  G10L 15/10
FI (5件):
G10L15/06 400V ,  G10L15/06 500Z ,  G10L15/20 353 ,  G10L15/06 200Z ,  G10L15/10 300G

前のページに戻る