Pat
J-GLOBAL ID:202203020332105751

音声認識プログラム、音声認識方法、音声認識装置および音声認識システム

Inventor:
Applicant, Patent owner:
Agent (1): 酒井 昭徳
Gazette classification:公開公報
Application number (International application number):2022106669
Publication number (International publication number):2022121643
Application date: Jun. 30, 2022
Publication date: Aug. 19, 2022
Summary:
【課題】事前設定せずとも音声ファイルに含まれる音声の話者人数および話者を簡単に推定できること。 【解決手段】端末100と、クラウド110が通信接続された音声認識システムにおいて、端末100は、音声の録音部102と、録音あるいは再生した音声ファイルDをクラウド110にアップロードする通信部と、を有する。クラウド110は、音声ファイルDに含まれる話者別の話者人数を推定し、あらかじめ用意された話者別の学習済モデルを参照し、推定した話者人数のそれぞれの話者を認識し、音声ファイルDに含まれる話者をタグ付けした情報を端末100に通知する。 【選択図】図1
Claim (excerpt):
コンピュータに、 音声ファイルに含まれる話者別の話者人数を推定し、 予め用意された話者別の学習済モデルを参照し、推定した前記話者人数のそれぞれの話者を認識し、 前記音声ファイルに含まれる話者をタグ付けする、 処理を実行させることを特徴とする音声認識プログラム。
IPC (5):
G10L 17/00 ,  G10L 15/30 ,  G10L 15/26 ,  G10L 15/06 ,  G10L 17/04
FI (5):
G10L17/00 200C ,  G10L15/30 ,  G10L15/26 ,  G10L15/06 500P ,  G10L17/04
Patent cited by the Patent:
Cited by applicant (8)
Show all

Return to Previous Page