文献
J-GLOBAL ID:201502201280795181   整理番号:15A0863847

ポスター会話における音響・視線情報を統合した話者区間及び相槌の検出

著者 (6件):
資料名:
巻: 2015  号: SLP-105  ページ: VOL.2015-SLP-105,NO.9 (WEB ONLY)  発行年: 2015年02月20日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 短報  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
学会やオープンラボなどでなされるポスターセッションにおける会話を対象として,各会話参与者がいつ発話したかという情報(話者区間)とそのうちの相槌を検出する手法を述べる。実際のポスター会話では,自然な話し言葉や周囲の騒音などにより検出精度が低下する。著者らは話者区間検出において,従来法で用いられてきた音響情報に対して,会話における発話権取得で重要な役割を担う視線情報を統合するマルチモーダルな手法を提案している。本稿では,視線特徴量と確率的統合モデルについて検討・改善を行った。また,検出した聴衆の発話区間が相槌であるかを,話者区間検出と同様のマルチモーダルな手法で判定し,相槌を発話区間から除去することで質問やコメントなどの発話のみを抽出する。実験結果から,音響情報と視線情報を統合することで雑音環境下での検出精度の向上が確認された。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  パターン認識 
引用文献 (24件):
もっと見る

前のページに戻る