2023年12月2日,郑州大学计算机与人工智能学院在新校区内迎来了一场知识的盛宴——CCF-NLP走进高校系列活动之“走进郑州大学”。本次活动是由中国计算机学会自然语言处理专业委员会(CCF-NLP)发起,联合MLNLP及各个知名高校开展的NLP研究分享活动。
在下午14:30至17:50的分享会中,四位自然语言处理领域的知名专家围绕大模型现状分析与创新应用、知识增强大模型、大语言模型开放评测体系的构建以及大模型的推理和泛化研究等主题,进行了深入浅出的讲解和研讨。活动现场座无虚席,除了郑州大学的部分师生外,还有来自中原工学院、河南工业大学、河南农业大学、中业科技公司、中原银行的相关人员。本次活动同时在MLNLP公众号及b站同期直播,反响热烈。
同济大学特聘研究员、博士生导师王昊奋教授作为开场嘉宾,简明扼要地介绍了CCF-NLP活动的背景及其意义。
随后,郑州大学自然语言处理实验室的昝红英老师向与会者介绍了郑州大学计算机与人工智能学院以及自然语言处理团队的工作情况。
首位分享报告的是上海交大博士、上海市优秀博士,同济大学百人计划特聘研究员,博士生导师王昊奋,报告题目为《知识增强大模型:垂域落地的最后一公里》。最近发展的大型语言模型在多项问题回答基准测试中展现出了与人类相似的性能。尽管如此,这些模型仍然面临一系列挑战,包括产生幻觉式错误、依赖过时信息、缺乏专业领域的深度知识等问题。通过采用知识增强技术,可以有效应对这些挑战,对于提升模型的准确性、时效性以及实用性至关重要。还能推动知识增强型大型模型在专业垂直领域的应用,实现技术在这些领域的深度融合和应用,达到“最后一公里”的突破。
中国科学院自动化研究所研究员、博士生导师,中国科学院大学岗位教授宗成庆进行了题为《大模型现状分析与创新应用》的报告分享。近期以来,以ChatGPT为代表的大语言模型快速发展,成为举世瞩目的热点,对各学科领域及行业发展产生了巨大冲击。那么,大语言模型的性能现状如何?大模型背景下如何开展自然语言处理研究?该报告在简要分析大模型性能现状的基础上,介绍几种面向大模型技术应用的创新方法,然后对自然语言处理未来发展的前景和研究范式予以展望和思考。
天津大学智能与计算学部教授、博士生导师,自然语言处理实验室负责人,天津市“一带一路”联合实验室语言智能与技术中外联合研究中心主任熊德意教授进行了题为《构建大语言模型开放评测体系》的报告分享。飞速发展的大语言模型将深入人类生活和社会的方方面面,引领开启人类新一次的产业革命。当前众多大模型,知识能力哪个最强?其表现是否符合社会伦理道德要求?同时,大模型这种前沿的人工智能技术若不加监管和控制的滥用,其也会带来巨大的安全风险。因此有必要从大模型的知识和能力、伦理对齐、安全性等维度等对其全方位评估。报告随后介绍了面向中文大模型的OpenEval评测平台,分享了当前正在构建的开放大语言模型评测体系的进展。
西湖大学张岳教授分享了研究课题《语言模型模型逻辑推理与泛化能力局限研究》。大模型的思维链能力,表明了大模型似乎具有逐步推理能力,这是否意味着大模型真正的学习到了人类的思考过程和逻辑推理能力?通过实验表明,大模型对于训练数据分布外的逻辑推理问题,仍具有泛化性不足的问题。从数据方面入手,可以使大模型的泛化能力获得一些改善,这表明大模型只是在做“应试教育”,并未真正具有人类逻辑推理的能力。如何让大模型真正像人类一样思考,这是未来有待解决的一大挑战。
CCF-NLP活动过后,熊德意教授及其团队、覃立波老师于2023年12月3日上午9点莅临国家超算中心自然语言处理实验室,与在场的师生们进行了深入的交流。他们鼓励学生们在研究中勇于探索未知领域,尤其是大模型的现状和未来发展,并指导同学们学术研究和工作,同时也强调了在学术研究中积极批判性思考的重要性。
老师们以生动的案例指导学生,当我们在学习和工作要利用大模型开拓未知的领域,尝试未知的范围,而不是在已知的领域去做Improvement;在学习过程中,还要多思考和不懈地去完成工作,要把我们的工作轻量化地分成各个节点和deadline;对于论文和科研知识,读和思考要紧密结合,把读变成每天科研地日常部分,读完之后一定要有批判性的思考。对于当前大模型的发展趋势和迅猛势头,老师建议我们在学习过程中还需要拓宽知识面,增强知识储备,把以前过时的东西迁移过来,而不是一味地放弃。
本次CCF-NLP走进高校之“走进郑州大学”活动不仅为郑州大学师生提供了一个接触国内顶尖NLP研究的机会,也为自然语言处理领域的学术交流与合作搭建了桥梁,必将对促进该领域的发展产生深远影响。