特許
J-GLOBAL ID:201803000378062441

音声認識装置、音声認識方法およびプログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人酒井国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2016-220855
公開番号(公開出願番号):特開2018-077440
出願日: 2016年11月11日
公開日(公表日): 2018年05月17日
要約:
【課題】音声信号に含まれる言語情報と、言語情報に付随するパラ言語情報および/または非言語情報とを認識する。【解決手段】実施形態に係る音声認識装置は、算出部と、探索部と、付加記号取得部と、出力部とを備える。算出部は、音声信号に基づき、予め定められた記号集合の要素である入力記号毎の音響スコアを含む複数のスコアベクトルが並んだスコアベクトル列を算出する。探索部は、スコアベクトル列における尤もらしい音響スコアを辿る入力記号の経路を探索することにより入力記号列を生成し、入力記号列に含まれる入力記号のうちの認識対象の言語情報を表す認識対象記号に基づき、音声信号の認識結果を表す出力記号を生成する。付加記号取得部は、入力記号列における出力記号に対応する範囲に含まれる入力記号の中から、パラ言語情報および/または非言語情報を表す付加記号を取得する。出力部は、出力記号と、取得した付加記号とを対応付けて出力する。【選択図】図3
請求項(抜粋):
音声信号に基づき、予め定められた記号集合の要素である入力記号毎の音響スコアを含む複数のスコアベクトルが並んだスコアベクトル列を算出する算出部と、 前記スコアベクトル列における尤もらしい前記音響スコアを辿る前記入力記号の経路を探索することにより入力記号列を生成し、前記入力記号列に含まれる前記入力記号のうちの認識対象の言語情報を表す認識対象記号に基づき、前記音声信号の認識結果を表す出力記号を生成する探索部と、 前記入力記号列における前記出力記号に対応する範囲に含まれる前記入力記号の中から、パラ言語情報および/または非言語情報を表す付加記号を取得する付加記号取得部と、 前記出力記号と、取得した前記付加記号とを対応付けて出力する出力部と を備える音声認識装置。
IPC (3件):
G10L 15/10 ,  G10L 15/08 ,  G10L 15/16
FI (4件):
G10L15/10 400Z ,  G10L15/08 200Z ,  G10L15/10 300Z ,  G10L15/16

前のページに戻る