抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
の異なるスタイルを用いる画像およびビデオのための魅力的な字幕を生成する課題に対処するためにStyleNetと呼ばれる新しいフレームワークを提案した。この目的のために,単一言語テキストコーパスにおけるスタイル要因を自動的に新しいモデル成分,因数分解LSTMと名付けたを考案した。実行時に,所望のスタイルと魅力的な視覚字幕を生成するために,字幕生成過程におけるスタイルを制御が可能になった。提案アプローチでは,二セットのデータを活用することによりこの目標を達成した1)事実image/video字幕対データ,および2)定型化された単一言語テキストデータ(例えば,恋愛とユーモアのある文)。StyleNetは,新たに収集したFlickrStyle10K画像キャプションデータセット上で自動及びヒト評価指標で測定した,これは対応するユーモアのあると恋愛字幕を持つ10K Flickr画像を含む異なるスタイルによる視覚字幕を生成するための既存の手法よりも優れていることを実験的に示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】