文献
J-GLOBAL ID:202202281028381547   整理番号:22A1102090

RealPRNet:”信頼できる”音声アニメーションのための実時間音素認識ネットワーク【JST・京大機械翻訳】

RealPRNet: A Real-Time Phoneme-Recognized Network for “Believable” Speech Animation
著者 (3件):
資料名:
巻:号:ページ: 5357-5367  発行年: 2022年 
JST資料番号: W2432A  ISSN: 2327-4662  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
技術開発により,ディスプレイ付きのますます多くのモノのインターネット(IoT)デバイスは,現実感を可視化して「面対面」相互作用を作る。ユーザのプライバシーを保護するために,通信はアバタを通して表現することができ,オーディオ駆動リアルタイム音声アニメーションを使用する。しかしながら,オーディオが唯一の利用可能な入力であるならば,結果の品質は,認識精度と待ち時間のようなリアルタイム音素認識に大きく依存する。本論文では,入力オーディオデータにおける空間および時間パターンを利用するために,新しい深層学習ベース実時間音素認識ネットワーク(RealPRNet)方式を導入した。長い短期メモリスタックブロックと長い短期特徴によって,実際のPRNetは音素認識において超性能を達成できる。この包括的な経験的結果は,最先端のアルゴリズムと比較して,実際のPRNetが最良事例で20%音素誤り率(PER)改善と4%ブロック誤差距離(BDE)改善を達成できることを示した。Copyright 2022 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る