特許
J-GLOBAL ID:202203020332105751

音声認識プログラム、音声認識方法、音声認識装置および音声認識システム

発明者:
出願人/特許権者:
代理人 (1件): 酒井 昭徳
公報種別:公開公報
出願番号(国際出願番号):特願2022-106669
公開番号(公開出願番号):特開2022-121643
出願日: 2022年06月30日
公開日(公表日): 2022年08月19日
要約:
【課題】事前設定せずとも音声ファイルに含まれる音声の話者人数および話者を簡単に推定できること。 【解決手段】端末100と、クラウド110が通信接続された音声認識システムにおいて、端末100は、音声の録音部102と、録音あるいは再生した音声ファイルDをクラウド110にアップロードする通信部と、を有する。クラウド110は、音声ファイルDに含まれる話者別の話者人数を推定し、あらかじめ用意された話者別の学習済モデルを参照し、推定した話者人数のそれぞれの話者を認識し、音声ファイルDに含まれる話者をタグ付けした情報を端末100に通知する。 【選択図】図1
請求項(抜粋):
コンピュータに、 音声ファイルに含まれる話者別の話者人数を推定し、 予め用意された話者別の学習済モデルを参照し、推定した前記話者人数のそれぞれの話者を認識し、 前記音声ファイルに含まれる話者をタグ付けする、 処理を実行させることを特徴とする音声認識プログラム。
IPC (5件):
G10L 17/00 ,  G10L 15/30 ,  G10L 15/26 ,  G10L 15/06 ,  G10L 17/04
FI (5件):
G10L17/00 200C ,  G10L15/30 ,  G10L15/26 ,  G10L15/06 500P ,  G10L17/04
引用特許:
出願人引用 (1件)

前のページに戻る