特許
J-GLOBAL ID:202303017282095950

音声情報処理装置、推測装置、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 竹居 信利
公報種別:公開公報
出願番号(国際出願番号):特願2022-131254
公開番号(公開出願番号):特開2023-029323
出願日: 2022年08月19日
公開日(公表日): 2023年03月03日
要約:
【課題】発話された音声の全体ではなく、音声の部分ごとの了解度を提示できる音声情報処理装置、推測装置、及びプログラムを提供する。 【解決手段】処理対象となった音声データと、当該音声データが読み上げているスクリプトとの入力を受け、処理対象となった音声データを提示して、ユーザから対応する音声データの入力を受け入れて記憶するシャドーイング処理と、処理対象となった音声データを、スクリプトとともに提示して、ユーザから対応する音声データの入力を受け入れて記憶するスクリプトシャドーイング処理とを実行し、それぞれの対応部分ごとに、その特徴量に基づく評価値を演算する音声情報処理装置である。 【選択図】図1
請求項(抜粋):
処理対象となった音声データと、当該音声データが読み上げているスクリプトとの入力を受けて、 前記処理対象となった音声データを提示して、ユーザから対応する音声データの入力を受け入れて記憶するシャドーイング処理手段と、 前記シャドーイング処理手段により音声データが受け入れられた後に、前記処理対象となった音声データを、前記スクリプトとともに提示して、ユーザから対応する音声データの入力を受け入れて記憶するスクリプトシャドーイング処理手段と、 前記シャドーイング処理手段が記憶した音声データと、前記スクリプトシャドーイング処理手段が記憶した音声データとについて、それぞれの音声データを、所定の特徴量の時系列データに変換し、各音声データにおいてスクリプトの同じ部分に対応すると推定される時系列上の位置を互いに一致させるとともに、所定の条件で音声データの対応部分ごとに分割し、当該分割して得られた対応部分ごとに、前記特徴量に基づく評価値を演算する評価手段と、 当該対応部分ごとの評価値を出力する出力手段と を含む音声情報処理装置。
IPC (8件):
G10L 25/60 ,  G10L 25/30 ,  G10L 15/10 ,  G10L 15/16 ,  G10L 15/00 ,  G09B 19/04 ,  G09B 19/06 ,  G09B 19/00
FI (8件):
G10L25/60 ,  G10L25/30 ,  G10L15/10 500Z ,  G10L15/16 ,  G10L15/00 200E ,  G09B19/04 ,  G09B19/06 ,  G09B19/00 G

前のページに戻る