特許
J-GLOBAL ID:202303013082021957

音声情報処理装置、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 竹居 信利
公報種別:公開公報
出願番号(国際出願番号):特願2022-131253
公開番号(公開出願番号):特開2023-029751
出願日: 2022年08月19日
公開日(公表日): 2023年03月06日
要約:
【課題】比較的簡便な構成で、ユーザが聴取した音声のどこを聞き取り損ねたかの評価を行うことができる音声情報処理装置、及びプログラムを提供する。 【解決手段】スクリプトと、当該スクリプトを読み上げたモデル音声データとを関連付けて保持するコーパスデータベースにアクセス可能に接続され、予め定められたフローに従って、モデル音声データを提示して、対応する音声データの入力をユーザから受け入れて記憶するシャドーイング処理と、モデル音声データを対応するスクリプトとともに提示して、対応する音声データの入力をユーザから受け入れて記憶するスクリプトシャドーイング処理と、を少なくとも一つずつ含む処理を順次実行し、モデル音声データと記憶した音声データとのうちから選択される一対の音声データについて、それぞれの音声データの対応する時点での特徴量の相関、ないしその統計値を演算する音声情報処理装置である。 【選択図】図1
請求項(抜粋):
スクリプトと、当該スクリプトを読み上げたモデル音声データとを関連付けて保持するコーパスデータベースにアクセス可能に接続され、 予め定められたフローに従って、 前記モデル音声データを提示して、対応する音声データの入力をユーザから受け入れて記憶するシャドーイング処理と、 前記モデル音声データを前記対応するスクリプトとともに提示して、対応する音声データの入力をユーザから受け入れて記憶するスクリプトシャドーイング処理と、 を少なくとも一つずつ含む処理を順次実行するフロー実行手段と、 前記モデル音声データと、前記フロー実行手段が記憶した音声データとのうちから選択される一対の音声データについて、それぞれの音声データを、所定の特徴量の時系列データに変換し、各音声データにおいてスクリプトの同じ部分に対応すると推定される時系列上の位置を互いに一致させて、対応する時点での前記特徴量の相関、ないしその統計値を演算する比較手段と、 を含み、当該特徴量の相関ないしその統計値の少なくとも一方を提示する音声情報処理装置。
IPC (5件):
G10L 25/51 ,  G10L 15/00 ,  G10L 15/12 ,  G10L 15/10 ,  G06F 3/16
FI (5件):
G10L25/51 ,  G10L15/00 200E ,  G10L15/12 Z ,  G10L15/10 500Z ,  G06F3/16 600

前のページに戻る