文献
J-GLOBAL ID:201902264018245550   整理番号:19A0696219

話速変換を利用する会話における映像同期手法とその効果

著者 (4件):
資料名:
巻: J102-A  号:ページ: 59-67 (WEB ONLY)  発行年: 2019年02月01日 
JST資料番号: U0470A  ISSN: 1881-0195  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
話速変換(SRC:speech rate conversion)とは,音声の高さを保ったまま速度を変える技術であり,聞き取りを支援する聴取補助技術の一つとして利用されている.これまでの,話速変換を用いた会話システム[3]では,音声はゆっくりとした発話に変換されるが,映像はリアルタイムで再生していた.そのため,話し手の視線行動等の発話に付随する非言語行動が音声と同期しなくなり,聞き手が受容する非言語行動などの情報が適切に得られず,話者の順番交替がしにくくなることが指摘されていた.本研究は,ゆっくりとした発話に変換された音声を聴取するユーザに対して,映像も音声と同期する,ゆっくりとした映像に加工し,リップシンクが取れる会話インタフェースの設計とその評価をする.会話実験では,話速変換によりゆっくりになった音声に映像を同期する3人会話の会話システムを構築し,映像同期・非同期の条件間で,話し手に宛先指定された聞き手の反応潜時(聞き手が,話し手の発話の終了時点を聴取してから,次話者として発話を開始するまでの時間)を計測し比較をした.その結果,映像同期の条件の方が非同期条件よりも反応潜時が短くなり,映像と音声を同期してゆっくりと再生する聴取環境が,ユーザの次発話のしやすさに寄与することを示す.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  音声処理 
引用文献 (10件):
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る