研課題
J-GLOBAL ID:202404005716254460  研究課題コード:23829671

構造を持つデータの学習可能性解析による巨大深層モデルの理解

体系的課題番号:JPMJAX23C4
実施期間:2023 - 2025
実施機関 (1件):
研究代表者: ( , 大学院情報理工学系研究科, 大学院生 )
DOI: https://doi.org/10.52926/JPMJAX23C4
研究概要:
現実世界のデータを低次元性と局所的な複雑性とを併せ持つものと定式化し、ニューラルネットがそれらを効率的に学習できることを最適化理論と統計理論を両立して示します。この理論を巨大深層モデルの解析に用い、事前学習での最適化から下流タスクの推論までを統一的に議論します。巨大深層モデルの成功の背後にある要素を明らかにし、モデル圧縮やデータセット構成といった実用手法への還元を目指します。
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した研究課題タイトルの用語をもとにしたキーワードです
研究制度:
上位研究課題: 次世代AIを築く数理・情報科学の革新
研究所管機関:
国立研究開発法人科学技術振興機構
報告書等:

前のページに戻る