抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
文書からの正確で詳細なコンテンツ(TOC)の生成は,文書理解と情報抽出のための主要な重要性の問題である。その重要性にもかかわらず,特に商業文書のような豊富なレイアウト情報を有する非標準化文書に対して,それは依然として挑戦的な課題である。本論文において,著者らは,すべての検索可能な文書に適用可能なTOC生成のための新しい神経ベースのパイプラインを提示した。以前の方法とは異なり,意味的ラベリングを使用せず,文書における部分的なTOCページの存在を仮定しない。さらに,テンプレートとして符号化した外部知識を用いることの影響を解析した。このアプローチは非常に低い資源環境においてのみ有用であることを経験的に示した。最後に,実世界文書におけるTOC生成の困難性に関するいくつかの光を明らかにする新しいドメイン固有データセットを提案した。提案した方法は,公開データセットと新しくリリースされたデータセットに関する最新技術よりも優れた性能を示した。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】