文献
J-GLOBAL ID:201002240332488116   整理番号:10A0213508

舌および唇の超音波画像および光画像により駆動される静粛音声インタフェイスの開発

Development of a silent speech interface driven by ultrasound and optical images of the tongue and lips
著者 (8件):
資料名:
巻: 52  号:ページ: 288-300  発行年: 2010年04月 
JST資料番号: W1590A  ISSN: 0167-6393  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,喉頭切除患者によるかまたは静粛な通信のためのいずれかにとって利用可能な,「静粛音声インタフェイス」アプリケーションのための,舌および唇の超音波画像および光画像(標準的CCDカメラ)により駆動される分節ボコーダを提案した。各音声クラスに対する音響観測に対してビジュアル観測を結合するオーディオビジュアル辞書の周りに提案システムは構築されている。PCAに基づく画像符号化技法を用いて,舌の超音波画像と唇のビデオ画像からビジュアルな特徴が抽出される。連続HMMにより各音声クラスのビジュアル観測がモデリングされる。提案システムでは次に,コーパスに基づく合成と音声認識段階の結合を行う。認識段階において,ビジュアル特徴列における音声ターゲット同定のためにこのビジュアルHMMを用いた。合成段階においては,ビジュアル空間における入力テストデータへの類似度を最大化する二重声の列に対する辞書探索をこれらの音声ターゲットが制約付けするが,それらは,音響領域の中の連結コストに従う。韻律テンプレートの抽出を訓練コーパスから行い,「調和プラスノイズモデル」結合合成技法を用いて最終音声波形の生成を行った。二人の話者のそれぞれから連続音声の1hを含むオーディオビジュアルデータベースに基づく実験結果を示した。Copyright 2010 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
人間機械系  ,  図形・画像処理一般  ,  パターン認識 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る