抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
セグメンテーションベースの方法は任意の形状テキスト検出に対して大きな成功を達成した。しかし,隣接テキストインスタンスの分離は,シーン画像におけるテキストの複雑性のために,まだ最も挑戦的な問題の1つである。本論文では,任意の形状テキスト検出のための革新的カーネルProposalネットワーク(dubbed KPN)を提案した。提案したKPNは,異なるテキストをインスタンス独立特徴マップに分類することにより,隣接テキストインスタンスを分離でき,一方,セグメンテーションベース任意形状テキスト検出法に存在する複雑な凝集プロセスを回避する。コンクリートであるために,著者らのKPNは,それぞれのテキスト画像のためのGauss中心マップを予測して,それは,それらの対応するキーポイント位置によって,埋込み特性マップから一連の候補カーネル提案(すなわち,動的畳込みカーネル)を抽出するために使用するであろう。カーネル提案間の独立性を強化するために,直交制約による新しい直交学習損失(OLL)を提案した。特に,著者らのカーネル提案は,位置埋込みによるネットワークと位置情報によって学習された重要な自己情報を含んでいる。最後に,カーネル提案は,テキストインスタンスの個々の埋込みマップを生成するために,すべての埋込み特徴マップを個別に畳み出す。この方法で,KPNは隣接テキストインスタンスを効果的に分離でき,不明瞭な境界に対するロバスト性を改善する。知る限りでは,本研究は,テキスト検出における隣接テキストインスタンスの接着問題を効率的に処理するための動的畳込みカーネル戦略を紹介した。挑戦的なデータセットに関する実験結果は,この方法の印象的な性能と効率を検証した。コードとモデルはhttps://github.com/GXYM/KPNで利用可能である。【JST・京大機械翻訳】