抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
話速変換(SRC:speech rate conversion)とは,音声の高さを保ったまま速度を変える技術であり,聞き取りを支援する聴取補助技術の一つとして利用されている.これまでの,話速変換を用いた会話システム[3]では,音声はゆっくりとした発話に変換されるが,映像はリアルタイムで再生していた.そのため,話し手の視線行動等の発話に付随する非言語行動が音声と同期しなくなり,聞き手が受容する非言語行動などの情報が適切に得られず,話者の順番交替がしにくくなることが指摘されていた.本研究は,ゆっくりとした発話に変換された音声を聴取するユーザに対して,映像も音声と同期する,ゆっくりとした映像に加工し,リップシンクが取れる会話インタフェースの設計とその評価をする.会話実験では,話速変換によりゆっくりになった音声に映像を同期する3人会話の会話システムを構築し,映像同期・非同期の条件間で,話し手に宛先指定された聞き手の反応潜時(聞き手が,話し手の発話の終了時点を聴取してから,次話者として発話を開始するまでの時間)を計測し比較をした.その結果,映像同期の条件の方が非同期条件よりも反応潜時が短くなり,映像と音声を同期してゆっくりと再生する聴取環境が,ユーザの次発話のしやすさに寄与することを示す.(著者抄録)