Proj
J-GLOBAL ID:202404014253353896
Research Project code:22682592
大規模言語モデルからの知識抽出に基づく視覚スクリプトの創成
大規模言語モデルからの知識抽出に基づく視覚スクリプトの創成
National award number:JPMJAX22AJ
Study period:2022 - 2024
Organization (1):
Principal investigator:
(
, 生産技術研究所, 特任研究員 )
DOI:
https://doi.org/10.52926/JPMJAX22AJ
Research overview:
動画像から場面に対応したスクリプト(典型的な事象系列)を予測するモデルを開発します。現行の動画像認識モデルは画像に見える事物の認識には優れていますが、その背後にある文脈を十分に扱えているとは言えません。本研究では、シーンから類推できるスクリプト知識を大量の文章で訓練された言語モデルより抽出することで、人が詳細な指示を与えずとも自らすべき行動を提案できるような「場を読める」AIの実現を目指します。
Terms in the title (5):
Terms in the title
Keywords automatically extracted from the title.
,
,
,
,
Research program:
>
>
Parent Research Project:
AI powered Rsearch Innovation / Creation
Organization with control over the research:
Japan Science and Technology Agency
Reports :
Return to Previous Page