文献
J-GLOBAL ID:202202284515054092   整理番号:22A1174317

スクリプト不変テキスト検出のための新しいマルチスケール深層ニューラルフレームワーク【JST・京大機械翻訳】

A Novel Multi-scale Deep Neural Framework for Script Invariant Text Detection
著者 (2件):
資料名:
巻: 54  号:ページ: 1371-1397  発行年: 2022年 
JST資料番号: W0953A  ISSN: 1370-4621  CODEN: NPLEFG  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
野生におけるテキスト検出はコンピュータビジョンにおける活発な研究問題である。制約のない環境におけるマルチスクリプトと任意指向シーン画像におけるテキストの位置決めは,この文脈における挑戦的な側面の1つである。本論文では,(i)マルチスクリプトテキスト検出のための新しいマルチスケール深層フレームワーク,(ii)Indicシナリオにおける多言語屋内屋外シーン画像,(iii)開発したデータセットに関するベンチマーク性能,および(iv)ICDAR 2019-MLTおよびICDAR2013(生まれた画像)のようないくつかの関連標準データセットに関する結果および比較分析,を提示した。(i)新しいデータセット,および(i)開発データセットに関するベンチマーク性能,および(iv)ICDAR 2019-MLTおよびICDAR 2013(生まれた画像)のようないくつかの関連標準データセットに関する結果および比較分析。厳密な実験を行い,得られた結果から,異なるスクリプト,フォントサイズ,テキスト配向などを有するテキストを局所化する際の開発したフレームワークの有効性を実証し,また,開発したフレームワークが既存の方法を凌駕し,実際のシナリオにおけるその有効性とロバスト性を意味する,本研究で考察したデータセットの大部分について最先端の性能を達成することを示した。Copyright The Author(s), under exclusive licence to Springer Science+Business Media, LLC, part of Springer Nature 2021 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  パターン認識 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る