文献
J-GLOBAL ID:201002243479852750   整理番号:10A0869353

話者独立視覚だけによる言語同定

SPEAKER INDEPENDENT VISUAL-ONLY LANGUAGE IDENTIFICATION
著者 (2件):
資料名:
巻: 2010 Vol.7  ページ: 5026-5029  発行年: 2010年 
JST資料番号: E0316B  ISSN: 1520-6149  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自動言語同定は成熟した技術であり,数秒の発話だけから高い同定精度が達成できる水準に達している。本論文は,視覚だけによる言語同定(VLID)の実験を述べた。この実験では,唇の形状,見かけ,動きだけを使用して話し言葉発話の言語を決定する。話者依存モードVLIDについては,オーディオLIDで使用されるGMMトークン化に類似した方法でサブ音声単位を使用して,マルチリンガル話者の話す言語を同定できることを先に報告した。本論文は,これを英語とフランス語の二言語話者独立モード同定に拡張した。話者に共通な視覚単位としては,音素の視覚的見かけであり音素間の厳密な関係であるvisemeを使用した。実験の結果は,visemeの認識精度が34%と低くても,妥当なVLIDが可能であった。visemeの認識精度を劣化させるシミュレーションでは,認識誤りが50%程度でも高いVLID精度が達成できた。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  パターン認識 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る