DeepQTMT:モード内VVCの高速QTMTベースCU分割のための深層学習アプローチ【JST・京大機械翻訳】

Li Tianyi; Xu Mai; Tang Runzhi; Chen Ying; Xing Qunliang

プレプリント

J-GLOBAL ID：202202209140697762 整理番号：21P0036833

DeepQTMT:モード内VVCの高速QTMTベースCU分割のための深層学習アプローチ【JST・京大機械翻訳】

DeepQTMT: A Deep Learning Approach for Fast QTMT-based CU Partition of Intra-mode VVC

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2020年06月23日プレプリントサーバーでの情報更新日： 2021年06月06日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。

最新の標準として,Versaileビデオ符号化(VVC)は,その先祖標準高効率ビデオ符号化(HEVC)の符号化効率を著しく改善するが,しかし,急激に増加した複雑性を犠牲にする。VVCでは,符号化ユニット(CU)分割の4分木+マルチタイプツリー(QTMT)構造は,再帰的速度歪(RD)最適化のための br力探索により,符号化時間の97%以上を占める。 br力QTMT探索の代わりに,本論文では,モード内VVCの符号化プロセスを劇的に加速するために,QTMTベースCU分割を予測するための深層学習アプローチを提案した。最初に,多様なビデオコンテンツを有する十分なCU分割パターンを含む大規模データベースを確立して,それはデータ駆動VVC複雑性低減を容易にすることができた。次に,多重段階における柔軟なQTMT構造と一致するCU分割を決定するために,初期出口機構を有する多段出口CNN(MSE-CNN)モデルを提案した。次に,MSE-CNNモデルを訓練するための適応損失関数を設計し,最小RDコストの分割モードとターゲットの不確実数の両方を合成した。最後に,マルチ閾値決定方式を開発し,複雑性とRD性能の間の望ましいトレードオフを達成した。実験結果は,著者らのアプローチが,1.322%-3.188%の無視できるBj{o}ntegaardデルタビットレート(BD-BR)で,VVCの符号化時間を44.65%~66.88%に低減でき,他の最先端の手法を著しく凌駕することを示した。【JST・京大機械翻訳】

, , , , ,
, , , , , , , , , 【Automatic Indexing@JST】

図形・画像処理一般

前のページに戻る