欢迎进入 兰州大学数学与统计学院

当前位置: 首页 > 学术交流 > 正文

"九章讲坛"第873讲 — 许志钦 副教授

日期:2024-08-15点击数:

应兰州大学数学与统计学院邀请,上海交通大学许志钦副教授将于2024年8月16-19日访问兰州大学,期间举办专题学术报告,欢迎全校师生参加。

报告题目: 现象驱动理解初始化对 Transformer 推理能力的影响

报告摘要:本报告关注现象驱动的深度学习的基础研究,将汇报频率原则、凝聚现象等常见现象,理解为什么神经网络会在过参数化下呈现好的泛化能力.进一步,在凝聚现象的基础上,我们讨论模型初始化对Transformer网络的推理能力的影响.

时 间:2024年8月18日(星期日)11:00.

地 点:理工楼631

欢迎广大师生光临!


报告人简介

许志钦,上海交通大学自然科学研究院/数学科学学院长聘教轨副教授。2012年本科毕业于上海交通大学致远学院。2016年博士毕业于上海交通大学,获应用数学博士学位。2016年至2019年,在纽约大学阿布扎比分校和柯朗研究所做博士后。现为Journal of Machine Learning的managing editor。

甘肃应用数学中心

数学与统计学院

萃英学院

2024年8月14日