文献
J-GLOBAL ID:202202282832119478   整理番号:22A1015513

機械学習と伝聞に基づく声質変化を用いた音声再現手法-原敬の音声再現への取組-

A Study on Speech Reconstruction Using Voice Changer Based on Machine Learning and Hearsay-Challenge to Reconstruct Mr. Takashi Hara’s Speech-
著者 (1件):
資料名:
巻: 17th  ページ: ROMBUNNO.2D1-05 (WEB ONLY)  発行年: 2022年 
JST資料番号: U1663A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
歴史的人物の再現音声は,魅力的なコンテンツの1つである。音声データがある場合には,そのデータに基づいて彼らの音声を再現できる。しかしながら,彼らの音声データは存在しないので,この場合には写真から推定した骨格に基づいてなら再現できる。このアプローチは高い特殊性が必要で困難なタスクであるが,本稿では,音質と話し方の再現を試みる新しいアプローチを提案した。このアプローチでは,対象者の音質を再現するために,顔の類似性と伝聞に基づくパラメータで人の音声を変化させる。人工ニューラルネットワークモデルを用いて,2人の顔画像間の差異から音質変化に対するパラメータを推定するモデルを構築した。このアイデアは,顔が似ている人は音声も似ているという経験則に基づいている。さらに,著者らは,伝聞知識として対象人物に関する文書や逸話を収集し,それらに基づくパラメータを手作業で設定した。人の音声をこれらのパラメータで変化させ,他の人の音声を再現した。本研究では,著者らのアプローチを評価するために,男性について再現した。実験結果により,再現された音声の精度を示すことはできないが,このアイデアによって日本の重要な首相である原敬についても再現した。これらの音声は,2022年3月から原敬記念館で展示されている。(翻訳著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る