Proj
J-GLOBAL ID:202404005716254460  Research Project code:23829671

構造を持つデータの学習可能性解析による巨大深層モデルの理解

構造を持つデータの学習可能性解析による巨大深層モデルの理解
National award number:JPMJAX23C4
Study period:2023 - 2025
Organization (1):
Principal investigator: ( , 大学院情報理工学系研究科, 大学院生 )
DOI: https://doi.org/10.52926/JPMJAX23C4
Research overview:
現実世界のデータを低次元性と局所的な複雑性とを併せ持つものと定式化し、ニューラルネットがそれらを効率的に学習できることを最適化理論と統計理論を両立して示します。この理論を巨大深層モデルの解析に用い、事前学習での最適化から下流タスクの推論までを統一的に議論します。巨大深層モデルの成功の背後にある要素を明らかにし、モデル圧縮やデータセット構成といった実用手法への還元を目指します。
Terms in the title (5):
Terms in the title
Keywords automatically extracted from the title.
Research program:
Parent Research Project: Innovations in Mathematical and Information Sciences to Build the Next-Generation AI
Organization with control over the research:
Japan Science and Technology Agency
Reports :

Return to Previous Page