专委首页 >> 领域动态

自然语言生成领域新进展学术论坛成功举办

  2021年5月28日下午,中文信息学会自然语言生成与智能写作专委会(筹)举办了以“自然语言生成领域新进展”为主题的论坛,论坛由哈尔滨工业大学计算学部自然语言处理研究所和黑龙江省人工智能头雁团队联合承办,以哈工大计算学部人工智能发展系列论坛(仲荣论坛)名义邀请广大师生参加。本次活动由专委会(筹)主任赵铁军教授主持,哈尔滨工业大学计算学部主任刘挺教授致开幕词,邀请了西湖大学张岳教授,中国人民大学宋睿华教授,字节跳动人工智能实验室总监李磊,清华大学教授黄民烈教授做专题报告。

  张岳教授作了题为《机器翻译的两点思考》的报告。机器翻译被认为是自然语言生成的一个典型任务。针对当前的神经机器翻译仍然存在着鲁棒性和领域泛化的问题,报告指出通过构建基准数据集CoGnition,从复合泛化的角度研究NMT模型,在使用复合翻译的错误率定量分析各种因素的影响,证明尽管NMT模型在传统指标下表现很好,但是在复合泛化方面表现不佳。针对Transformer模型监督训练的失败问题,指出失败的主要原因在于训练期间的局部最小值和注意力的复杂度造成的,提出将局部性假设作为归纳偏置引入Transformer模型中,在加速训练的同时保持模型的鲁棒性。

  宋睿华教授作了题为《生成-构造-体验:做好玩儿的AI创作》的报告。针对如何让AI进行创造,本次报告提出了从生成到创造,再到体验的三步走策略;同时为进一步理解AI创造,介绍了AI模型‘悟道.文澜’的设计理念,模型方案和训练过程。最后介绍了人工智能创作的挑战和机会。

  李磊研究员作了题为《高效可控可解释的文本生成算法》。首先介绍了自然语言生成的广泛应用,例如机器翻译,智能写作,聊天机器人,移动APP等。随后点出了自然语言生成领域的重大挑战,包括难以解释性,可控性和可扩展性等。

  黄民烈教授作了题为《故事理解与生成》。首先提出故事理解的三个难点,分别为局部和全局的连贯性建模,常识知识和推理和理解故事背后的寓意;并对三个难点进行分析解释。随后介绍了故事的生成,包括从一个标题,开头或者一个简短的提示生成一个连贯的故事以及一个开放结尾的故事生成任务。最后针对故事生成质量的评估,提出了三个评价方法的挑战和解决方案。

  就专题报告的内容,与会的专家学者对自然语言生成领域的新进展进行了充分讨论,对如何促进该领域的发展进行探讨。这是一次难得的领域内研发人员广泛交流的机会。