抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ビデオフレーム内のテキストは視覚コンテンツ理解,検索とブラウジングのための重要な情報を持っている。本論文では,二つの主要ステップで進行することをビデオテキスト領域抽出と分類アプローチを提案した:テキスト領域抽出とそれに続くテキスト領域分類。第一段階では,テキスト領域の出現を最初に検出,それらを局在化し,抽出するために分割併合プロセスに基づくアプローチを用いた。有効領域を明らかにしたフィルタリング過程を扱った。分類のために,抽出されたテキスト領域を意味論的な種類に分類に畳込みニューラルネットワーク(CNN)を提案した。,コンテンツの視覚的テーブルは,意味的ディスクリプタ(地名,選手名,イベント等すなわち。)により濃縮されたビデオ系列内で発生する抽出と分類されたテキスト領域に基づいて生成した。これらのテキスト領域を非線形含量ビデオブラウジングを提供する視覚指標と考えられている。多様なビデオシーケンスの上で行った実験により,提案アプローチの効率性を示した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】