発話を処理する方法

発明者： , , ,
出願人/特許権者：
代理人 (5件)：曾我道治 , 梶並順 , 大宅一宏 , 上田俊一 , 吉田潤一郎
公報種別：公表公報
出願番号（国際出願番号）：特願2018-503606
公開番号（公開出願番号）：特表2018-528458
出願日： 2016年11月29日
公開日（公表日）： 2018年09月27日
要約：

方法及びシステムが、自動音声認識(ASR)システム又はテキストから取得された発話を処理する。発話は、役割Aの発話及び役割Bの発話等の各当事者の関連付けられたアイデンティティを有する。単語シーケンス及びアイデンティティ等の発話に対応する情報は特徴に変換される。各特徴は、ニューラルネットワーク(NN)の入力層において受信される。NNの射影層において各特徴の次元が低減され、次元が低減された特徴が生成される。次元が低減された特徴は、処理され、発話のためのラベルの確率が提供される。

請求項（抜粋）：

発話を処理する方法であって、単語シーケンスとして複数の当事者から発話を取得するステップであって、各発話は各当事者の関連付けられたアイデンティティを有する、ステップと、前記単語シーケンス及びアイデンティティを特徴に変換するステップと、ニューラルネットワーク(NN)の入力層において各特徴を受信するステップと、前記NNの射影層において、各特徴の次元を低減して、次元が低減された特徴を生成するステップと、前記次元が低減された特徴を処理して、前記NNの前記隠れ層を通じて前記特徴を伝播するステップと、前記NNの出力層において、前記発話のためのラベルの事後確率を求めるステップと、を含み、前記ステップはプロセッサにおいて実行される、方法。

IPC (2件)：

G10L 15/16 , G06F 17/27

FI (3件)：

G10L15/16 , G06F17/27 665 , G06F17/27 615

Fターム (2件)：

5B091EA01 , 5B091EA02

引用特許：

出願人引用 (1件)

話者適応音声認識装置
公報種別：公開公報出願番号：特願平3-198179 出願人：富士通株式会社

審査官引用 (1件)

話者適応音声認識装置
公報種別：公開公報出願番号：特願平3-198179 出願人：富士通株式会社

引用文献：

出願人引用 (2件)

審査官引用 (2件)

前のページに戻る