特許
J-GLOBAL ID:201603018943267640

音響モデル学習支援装置、音響モデル学習支援方法

発明者:
出願人/特許権者:
代理人 (3件): 平木 祐輔 ,  関谷 三男 ,  渡辺 敏章
公報種別:公開公報
出願番号(国際出願番号):特願2015-041467
公開番号(公開出願番号):特開2016-161823
出願日: 2015年03月03日
公開日(公表日): 2016年09月05日
要約:
【課題】音声の文字表現を識別する音響モデルを効率的に学習するとともに、音響モデルによる音声識別精度を向上させる。【解決手段】本発明に係る音響モデル学習支援装置は、学習音声データの音声品質を変化させた変化音声データを識別する過程において得られた中間層出力値と、前記学習音声データを識別する過程において得られた中間層出力値との間の距離が大きい場合は、前記変化音声データを用いて追加学習を実施する。【選択図】図1
請求項(抜粋):
音声の特徴量を入力することにより前記音声の文字表現を識別するニューラルネットワークである音響モデルを学習することを支援する音響モデル学習支援装置であって、 前記音響モデルを記述した音響モデルデータを格納する記憶部、 前記音響モデルを学習するために用いる学習音声データの特徴量を変化させることにより変化音声データを生成する変化音声生成部、 前記音響モデルを用いて前記学習音声データを識別した結果得られた前記音響モデルの中間層出力値と、前記音響モデルを用いて前記変化音声データを識別した結果得られた前記音響モデルの中間層出力値との間の第1距離を算出する距離計算部、 前記第1距離が第1閾値以上である場合、前記変化音声データは前記音響モデルの追加学習を実施する際に用いるのに適した候補である旨を示すデータを出力する、学習効果提示部、 を備えることを特徴とする音響モデル学習支援装置。
IPC (3件):
G10L 15/06 ,  G10L 15/16 ,  G06N 3/08
FI (3件):
G10L15/06 300Y ,  G10L15/16 ,  G06N3/08

前のページに戻る