抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
最新の標準として,Versaileビデオ符号化(VVC)は,その先祖標準高効率ビデオ符号化(HEVC)の符号化効率を著しく改善するが,しかし,急激に増加した複雑性を犠牲にする。VVCでは,符号化ユニット(CU)分割の4分木+マルチタイプツリー(QTMT)構造は,再帰的速度歪(RD)最適化のための br力探索により,符号化時間の97%以上を占める。 br力QTMT探索の代わりに,本論文では,モード内VVCの符号化プロセスを劇的に加速するために,QTMTベースCU分割を予測するための深層学習アプローチを提案した。最初に,多様なビデオコンテンツを有する十分なCU分割パターンを含む大規模データベースを確立して,それはデータ駆動VVC複雑性低減を容易にすることができた。次に,多重段階における柔軟なQTMT構造と一致するCU分割を決定するために,初期出口機構を有する多段出口CNN(MSE-CNN)モデルを提案した。次に,MSE-CNNモデルを訓練するための適応損失関数を設計し,最小RDコストの分割モードとターゲットの不確実数の両方を合成した。最後に,マルチ閾値決定方式を開発し,複雑性とRD性能の間の望ましいトレードオフを達成した。実験結果は,著者らのアプローチが,1.322%-3.188%の無視できるBj{o}ntegaardデルタビットレート(BD-BR)で,VVCの符号化時間を44.65%~66.88%に低減でき,他の最先端の手法を著しく凌駕することを示した。【JST・京大機械翻訳】