任意形状テキスト検出のためのカーネル提案ネットワーク【JST・京大機械翻訳】

Zhang Shi-Xue; Zhu Xiaobin; Hou Jie-Bo; Yang Chun; Yin Xu-Cheng

プレプリント

J-GLOBAL ID：202202212643774242 整理番号：22P0303060

任意形状テキスト検出のためのカーネル提案ネットワーク【JST・京大機械翻訳】

Kernel Proposal Network for Arbitrary Shape Text Detection

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2022年03月12日プレプリントサーバーでの情報更新日： 2023年06月19日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

セグメンテーションベースの方法は任意の形状テキスト検出に対して大きな成功を達成した。しかし,隣接テキストインスタンスの分離は,シーン画像におけるテキストの複雑性のために,まだ最も挑戦的な問題の1つである。本論文では,任意の形状テキスト検出のための革新的カーネルProposalネットワーク(dubbed KPN)を提案した。提案したKPNは,異なるテキストをインスタンス独立特徴マップに分類することにより,隣接テキストインスタンスを分離でき,一方,セグメンテーションベース任意形状テキスト検出法に存在する複雑な凝集プロセスを回避する。コンクリートであるために,著者らのKPNは,それぞれのテキスト画像のためのGauss中心マップを予測して,それは,それらの対応するキーポイント位置によって,埋込み特性マップから一連の候補カーネル提案(すなわち,動的畳込みカーネル)を抽出するために使用するであろう。カーネル提案間の独立性を強化するために,直交制約による新しい直交学習損失(OLL)を提案した。特に,著者らのカーネル提案は,位置埋込みによるネットワークと位置情報によって学習された重要な自己情報を含んでいる。最後に,カーネル提案は,テキストインスタンスの個々の埋込みマップを生成するために,すべての埋込み特徴マップを個別に畳み出す。この方法で,KPNは隣接テキストインスタンスを効果的に分離でき,不明瞭な境界に対するロバスト性を改善する。知る限りでは,本研究は,テキスト検出における隣接テキストインスタンスの接着問題を効率的に処理するための動的畳込みカーネル戦略を紹介した。挑戦的なデータセットに関する実験結果は,この方法の印象的な性能と効率を検証した。コードとモデルはhttps://github.com/GXYM/KPNで利用可能である。【JST・京大機械翻訳】

, , , , , , , , , , , ,
, , , 【Automatic Indexing@JST】

図形・画像処理一般 , パターン認識

, ,

前のページに戻る