抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・意味情報に対応する概念を手がかりとして,混合音・声信号から目的音声信号を抽出するConceptBeamの提案評価実験を実施。
・2名の話者が個別の画像ついて説明する混合音声信号を入力とし,画像によって指定された概念に関わる音声信号を抽出したところ,提案手法の基本動作を確認。
・音声の重なりや雑音を考慮した画像/音声埋め込みネットワークの学習,またはこのネットワークを含めたConceptBeam全体を最適化する学習手続きの検討が必要。
・ある画像やトピックを複数の話者が会話するシーンにおいて,それらをまとめて目的信号として抽出するようConceptBeamを拡張することも今後予定。