NLG专委会真知论坛（GenTalk第2期）多模态文本生成圆满结束！

专委首页 >> 领域动态

NLG专委会真知论坛（GenTalk第2期）多模态文本生成圆满结束！

2022年9月5日 | CIPS_NLGIW | 领域动态

2022年6月30日晚18点30分，NLG专委会主题讲坛（GenTalk第2期）多模态文本生成于线上正式召开。真知论坛由中国中文信息学会自然语言生成与智能写作专委会主办，每月举办一次，每次邀请2-3名左右自然语言生成和智能写作领域的资深专家，就某一主题与大家分享最新的成果以及领域进展。

本次真知论坛由南京航空航天大学李丕绩教授和香港理工大学电子计算学系的助理教授李菁担任主持，有幸邀请到的两位资深专家为腾讯AI Lab的唐都钰博士和微软亚洲研究院的董力博士，就主题“多模态文本生成”为大家带来最新成果以及相关经验的报告和分享。

第一场报告由李菁教授主持，唐都钰博士进行。报告围绕预训练+微调的主流学习范式展开，讲解了该学习范式目前的进展以及核心难点，即，对于每个下游任务需要单独微调预训练模型的全部参数，每个新任务都需要从头微调，遗忘了从历史任务中学习的技能。最后，针对上述挑战，提出了解决多任务多模态问题的稀疏模SkillNet，有效利用历史任务中学习的技能去学习新的任务。

香港理工大学电子计算学系的助理教授李菁主持

腾讯AI Lab唐都钰博士进行报告

第二场报告由李丕绩教授主持，董力博士进行。报告围绕图像-文本预训练模型展开，先介绍了预训练（自学习）的新范式与文本领域的transformer模型。进而讲述了基于文本领域模型发展出的图像领域预训练模型BEiT，和图像领域的transformer模型，ViT。在上述模型基础上，发展出了文本-图像联合预训练模型VL-BEiT。最后，对文本与图像领域预训练模型进行总结。

南京航空航天大学李丕绩教授主持

微软亚洲研究院董力博士进行报告

会议视频回放

• Gentalk第二期