研課題
J-GLOBAL ID:202504017931729075
研究課題コード:24030890
統計理論に基づく注意機構の能力解明と効率化
体系的課題番号:JPMJAX24CK
実施期間:2024 - 2026
実施機関 (1件):
研究代表者:
(
, 大学院情報理工学系研究科, 大学院生 )
DOI:
https://doi.org/10.52926/JPMJAX24CK
研究概要:
深層基盤モデルのスタンダードとして活躍するTransformerは、注意機構と呼ばれる計算量が大きい手法に依存しています。省コストな代替手法が数多く提案されていますが、それらの能力は注意機構には及びません。本研究では、注意機構と代替手法の能力を統計理論に基づいて解明します。注意機構を代替手法で置き換えても性能が落ちない状況を明らかにすることで、効率的かつ高性能なネットワークの設計を目指します。
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した研究課題タイトルの用語をもとにしたキーワードです
,
,
研究制度:
>
>
上位研究課題:
次世代AIを築く数理・情報科学の革新
研究所管機関:
前のページに戻る