抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,Transformerをコンピュータビジョンに応用したネットワークが注目を集めており,優れた結果を残しているが,計算量やメモリの使用量が欠点でもある.そこで,本論文ではImage to Image TranslationのネットワークであるLaplacian Pyramid Translation Transformer(LPTT)を提案する.LPTTはラプラシアンピラミッドを作成することで計算量やメモリの使用量を抑えつつTransformerの表現力を得ており,従来手法と比べて優れた結果を残している.LPTTはTransformerを含むネットワークで4Kほどの高解像度画像に対してリアルタイム推論が行える初めてのネットワークである.また,LPTTは条件によっては8K画像もリアルタイムで推論できる.また,本論文では,高解像度の画像を処理する場合でもTransformerに低解像度の成分を計算させるだけで性能を上げることができるということを示唆している.(著者抄録)