特許
J-GLOBAL ID:201703009374197792

音声認識装置

発明者:
出願人/特許権者:
代理人 (6件): 田澤 英昭 ,  濱田 初音 ,  中島 成 ,  坂元 辰哉 ,  辻岡 将昭 ,  井上 和真
公報種別:特許公報
出願番号(国際出願番号):特願2016-541466
特許番号:特許第6054004号
出願日: 2016年01月29日
要約:
【要約】 基底行列の寄与度計算手段(103)は、基底行列(106)を用いて、基底行列の寄与度(107)を算出する。基底行列への重み適用手段202は、基底行列の重み(206)と、基底行列の寄与度(107)と、基底行列(106)とを用いて、基底行列への重み付けを行った変換行列(207)を生成する。特徴量データへの行列適用手段(203)は、変換行列(207)を用いて、テストデータ(206)を変換済みテストデータ(208)とする。デコード手段(204)は、変換済みテストデータ(208)と音響モデル(105)とを照合して音声認識を行う。
請求項(抜粋):
【請求項1】 学習データの音響特徴量を用いて当該学習データの標準パターンをモデル化した音響モデルを算出する音響モデル算出部と、 前記音響モデルと前記学習データとを用いて、基底行列を算出する基底行列算出部と、 前記基底行列を用いて、基底行列の寄与度を算出する基底行列の寄与度計算部と、 テストデータの音響特徴量と、前記音響モデルと、前記基底行列とを用いて、基底行列の重みを算出する基底行列への重み算出部と、 前記基底行列の重みと、前記基底行列の寄与度と、前記基底行列とを用いて、基底行列への重み付けを行った変換行列を生成する基底行列への重み適用部と、 前記変換行列を用いて、前記テストデータを前記音響モデルと認識するための変換済みテストデータに変換する特徴量データへの行列適用部と、 前記変換済みテストデータと前記音響モデルとを照合して音声認識を行うデコード部とを備えた音声認識装置。
IPC (1件):
G10L 15/07 ( 201 3.01)
FI (1件):
G10L 15/07
引用特許:
出願人引用 (1件) 審査官引用 (1件)
引用文献:
前のページに戻る