2023年11月17日下午,应公司邀请,杭州电子科技大学俞俊教授在25号楼920会议室开展了以“基于Transformer框架的多模态学习”为主题的学术 讲座活动,讲座由公司副经理蒋明峰教授主持,公司部分师生代表参加了此次讲座。
在深度神经网络对视觉、语言等不同模态信息进行统一建模的多模态深度学习已成为近年来研究的热点问题的背景下,俞俊教授首先对多模态深度学习发展过程中代表性工作进行了简要介绍,并提及了Transformer的结构以及其与自然语言处理和计算机视觉的结合;然后对当前基于Transformer框架的多模态深度学习领域的三种代表方法:基于多模态多任务联合学习、多模态神经架构搜索、多模态预训练的若干代表性工作进行了详细的介绍;在讲座的最后向我们介绍了多模态分析的未来方向及挑战。
俞俊教授报告内容丰富,不仅在报告中对员工科研方向提出相关建议,而且对师生提出问题进行了详细解答。通过俞俊教授的介绍,使得大家对多模态学习的内容以及其未来发展方向有了更深一步的理解。