特許
J-GLOBAL ID:202003017431962849

音声認識装置及び音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人藤央特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2018-136203
公開番号(公開出願番号):特開2020-013034
出願日: 2018年07月19日
公開日(公表日): 2020年01月23日
要約:
【課題】複数の話者の音声を分離して音声認識を実現する。【解決手段】プロセッサとメモリを有する音声認識装置であって、複数の話者の音声が混合された第1の音声データから第1の音声特徴量を算出する音声特徴量算出部と、前記第1の音声データに含まれる各音声の書き起こしデータおよび各音声の発話の順序を格納した発話順序情報と、前記第1の音声特徴量と前記発話順序情報に基づいて音響モデルを学習する学習部と、を有する。【選択図】図2
請求項(抜粋):
プロセッサとメモリを有する音声認識装置であって、 複数の話者の音声が混合された第1の音声データから第1の音声特徴量を算出する音声特徴量算出部と、 前記第1の音声データに含まれる各音声の書き起こしデータおよび各音声の発話の順序を格納した発話順序情報と、 前記第1の音声特徴量と前記発話順序情報に基づいて音響モデルを学習する学習部と、 を有することを特徴とする音声認識装置。
IPC (2件):
G10L 15/06 ,  G10L 15/28
FI (2件):
G10L15/06 300Y ,  G10L15/28 353
引用特許:
審査官引用 (1件)
  • 混合音声認識
    公報種別:公表公報   出願番号:特願2016-558287   出願人:マイクロソフトテクノロジーライセンシング,エルエルシー
引用文献:
審査官引用 (1件)
  • A Purely End-to-end System for Multi-speaker Speech Recognition

前のページに戻る