特許
J-GLOBAL ID:202403005968006457
コンテンツ生成システム、コンテンツ生成装置、ユーザ端末、コンテンツ生成方法、及びプログラム
発明者:
,
,
,
,
出願人/特許権者:
,
代理人 (4件):
松沼 泰史
, 鈴木 史朗
, 清水 雄一郎
, 大槻 真紀子
公報種別:公開公報
出願番号(国際出願番号):特願2022-203135
公開番号(公開出願番号):特開2024-088118
出願日: 2022年12月20日
公開日(公表日): 2024年07月02日
要約:
【課題】医療説明における聞き手の利便性を向上させること。
【解決手段】コンテンツ生成システムは、読み上げ対象である医療説明用テキストを示すテキストデータを取得する取得部と、ユーザが学習用テキストを読み上げた際の音声に基づいて学習された音声生成モデルと、前記医療説明用テキストのジャンルに応じた音声ライブラリとを用いて、前記テキストデータが示す前記医療説明用テキストが前記ユーザの音声で読み上げられる合成音声を生成する音声生成部と、前記合成音声による読み上げ速度を調整する調整部と、前記テキストデータが示す前記医療説明用テキストに基づき字幕テキストを生成する字幕生成部と、前記字幕テキストと、前記調整された前記合成音声と前記ユーザの本人画像とを合成して前記ユーザのデジタルクローンを表すクローンデータを医療説明用合成コンテンツとして生成する合成部と、を備える。
【選択図】図1
請求項(抜粋):
読み上げ対象である医療説明用テキストを示すテキストデータを取得する取得部と、
ユーザが学習用テキストを読み上げた際の音声に基づいて学習された音声生成モデルと、前記医療説明用テキストのジャンルに応じた音声ライブラリとを用いて、前記テキストデータが示す前記医療説明用テキストが前記ユーザの音声で読み上げられる合成音声を生成する音声生成部と、
前記合成音声による読み上げ速度を調整する調整部と、
前記テキストデータが示す前記医療説明用テキストに基づき字幕テキストを生成する字幕生成部と、
前記字幕テキストと、前記調整された前記合成音声と、前記ユーザの本人画像とを合成して前記ユーザのデジタルクローンを表すクローンデータを医療説明用合成コンテンツとして生成する合成部と、
を備えるコンテンツ生成システム。
IPC (4件):
G10L 13/033
, G10L 13/08
, G10L 13/10
, G10L 13/00
FI (6件):
G10L13/033 102Z
, G10L13/08 122
, G10L13/10 112Z
, G10L13/10 111Z
, G10L13/10 112B
, G10L13/00 100S
引用特許:
前のページに戻る