プレプリント
J-GLOBAL ID:202202210757180331   整理番号:22P0303523

TSR-DSAW:単語の深い空間連想によるテーブル構造認識【JST・京大機械翻訳】

TSR-DSAW: Table Structure Recognition via Deep Spatial Association of Words
著者 (4件):
資料名:
発行年: 2022年03月14日  プレプリントサーバーでの情報更新日: 2022年03月14日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
カメラ捕獲または走査文書からのテーブル構造認識(TSR)のための既存の方法は,入れ子列/柱,マルチラインテキストおよび欠測セルデータから成る複雑なテーブル上で十分に機能しない。これは,現在のデータ駆動法が,大量のデータに関する深いモデルを単純に訓練し,そして,非セイステーブル構造が遭遇するときに一般化できないためである。本論文では,テーブル構造を解明するためにテーブル画像に存在する異なる単語ペア間の空間相関を捉えるために,深いネットワークを訓練することを提案する。HTMLのような構造化フォーマットにおけるテーブル画像のディジタル表現を出力する,Wordsの深い空間協会を介してTSR-DSAW:TSRと名付けたエンドツーエンドパイプラインを提示した。入力としてテーブル画像を与えて,提案方法は,CRAFTのようなテキスト検出ネットワークを用いて,画像中に存在するすべての単語の検出から始まり,動的プログラミングを用いた単語対の生成が続く。これらの単語対は,個々の画像で強調され,次に,同じ列,同じカラム,同じセルまたは全くない空間相関を捕えるために訓練された高密度Net121分類器に供給される。最後に,HTMLフォーマットにおけるテーブル構造を生成するために,分類器出力に関する後処理を行った。2つの公開テーブル画像データセット,-PubTabNetとICDAR2013に関するTSR-DSAWパイプラインを評価し,テーブルネットとDeepDRTのような以前の方法の改善を実証した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  その他の情報処理  ,  パターン認識 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る