抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
最先端の文書デワーピング技法は,不規則な歪みまたは深さの大きな変動を有する文書を扱う間,誤りの傾向がある文書の3次元情報を予測するように学習する。本論文では,FDRNet,異なる歪みで文書を復元し,信頼性が高く簡単な方法で文書認識を改善することができる,Fourier文書復元ネットワークを提示した。FDRNetは,ほとんどの構造情報を捉えるフーリエ空間における高周波成分に焦点を合わせるが,外見における劣化は多くない。それは,訓練における変形アノテーションを必要とせずに,様々な変形を効果的に扱うことができる柔軟な薄いPlateスプライン変換によって文書をデワープする。これらの特徴は,FDRNetが少量の簡単なラベル付き訓練画像から学習することを可能にし,学習されたモデルは複雑な幾何学的歪みで文書を解読し,正確に復元されたテキストを認識することができる。文書復元研究を容易にするために,異なる型の幾何および測光歪を有する1000以上のカメラ文書から成るベンチマークデータセットを作成した。大規模な実験は,FDRNetが,デワーピングとテキスト認識タスクの両方に関する大きなマージンによって最先端技術より優れていることを示した。さらに,FDRNetは,簡単なラベル付き訓練データを必要とし,展開が容易である。【JST・京大機械翻訳】