抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文の目的は,ジェスチャ,音声,音とビジョンのようなヒトへの自然なコミュニケーションモダリティの使用を導入した人間-機械コミュニケーションの進化による異なるモダリティ(テキスト,画像)間の情報の変換を研究することである。実際では,この「マルチモーダル」学習の主な課題の一つは,異なるモダリティ間の共有表現と他に条件付けられたモダリティからの欠測データ(例えば,検索や合成)の予測の学習である。いくつかの研究は,異なるタイプの変換に働く音声,音声への画像またはテキストへのテキストに画像合成法及び同様であるその逆が,この論文では,に焦点を当てた:テキストへの画像(TTP)と画像テキスト(PTT)の合成。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】