プレプリント
J-GLOBAL ID:202202220213781426   整理番号:22P0025417

インドの言語におけるシーンテキスト認識のための転移学習【JST・京大機械翻訳】

Transfer Learning for Scene Text Recognition in Indian Languages
著者 (3件):
資料名:
発行年: 2022年01月10日  プレプリントサーバーでの情報更新日: 2022年01月10日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
低資源インド言語におけるセンテキスト認識は,複数のスクリプト,フォント,テキストサイズ,および方向のような複雑性のため,挑戦的である。本研究では,英語から2つの一般的インド言語までの深層シーンテキスト認識ネットワークの全ての層に対する転送学習の電力を調べた。従来のCRNNモデルとSTAR-Netの実験を行い,一般化可能性を保証した。異なるスクリプトにおける変化の影響を研究するために,まず,ユニコードフォントを用いてレンダリングされた合成単語画像に関する実験を行った。インド言語の簡単な合成データセットへの英語モデルの転送は実用的ではないことを示した。代わりに,著者らは,それらのn-gram分布の類似性と母音と結合特性のような視覚特徴のため,インド言語間の転送学習技術を適用することを提案する。次に,フォントと単語長統計における様々な複雑性を持つ6つのインド言語間の移動学習を研究した。また,他のインド言語から転送されたモデルの学習された特徴は,英語から転送されたそれらよりも,個人モデルの特徴に対して視覚的に近かった(そして時にはさらに良い)ことを示した。最後に,従来の研究と比較して,Word認識率(WRRs)で6%,5%,2%,および23%の利得を達成して,MLT-17から,Hindi,Telgu,およびMalayamデータセットから,Hindi,TelguおよびBanglaデータセットのシーンテキスト認識のための新しいベンチマークを最終的にセットした。さらに,MLT-17 Banglaの結果を,新しい補正BiLSTMのモデルへの閉塞により改善した。さらに,500のGujaratiと2535のTamil単語を含む約440のシーン画像のデータセットを解放した。WRRは,MLT-19 HindiおよびBanglaデータセットおよびGujaratiおよびTamilデータセット上で,ベースラインより8%,4%,5%および3%改善した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る