当前位置: HOME >> FLERIC News >> Content

饶高琦博士主讲第五届鹤琴讲坛

发布者: [发表时间]:2025-12-07 [来源]: [浏览次数]:

2025年12月2日,北京外国语大学中国外语与教育研究中心在西校区国际大厦309教室举行一年一度的“北外语料库日”活动暨第五届“鹤琴讲坛”。本次讲座由北京语言大学饶高琦博士主讲,报告题为“生成式人工智能时代:还需要语料库吗?”

围绕生成式人工智能时代下的语料库建设这一核心问题,饶高琦博士从多个方面展开论述。饶博士引用王春辉教授的观点,指出当下语言生活主体已经进入“人类、机器人、数字人”的“三人时代”。语言数据生产也转变为“人类+机器+人机语言行为”的新格局。在大模型时代,语料库建设正逐渐走向“需求驱动+平衡采样”,其规模与质量并重;语料库与模型的关系可被理解为“师生”模式,提出好问题、好需求以及蒸馏技术尤为关键。在研究理念和伦理挑战方面,饶博士强调,大模型时代的研究不仅要“试探模型表现”,把语料库视作测试集,还必须正视“回音室效应”、生成内容溯源困难以及如何用语料定义“好”“安全”等对齐难题。

围绕“探针实验”“提示词工程”“领域语料库建设”以及“压缩产生智能与知识表示”等话题,饶博士进一步梳理了生成式人工智能背景下的前沿议题。饶博士指出,生成式人工智能时代的研究话题和方法具有明显的“叠加”特征,“用大模型”和“为了大模型”是两大重要取向,大模型评测已成为“当世显学”。学界应充分重视大模型的价值,包括提示词本身的知识产权价值,大模型作为语言资源的价值,以及与大模型共生作为新的语言生活场景的价值。现场还展示了多种生成式教学资源的案例,为教学和人工智能的结合提供了具体思路。

在提问与讨论环节,参会师生就语料库在大模型时代的定位、领域语料库建设路径等问题与饶博士进行了热烈交流。本次报告视野开阔、内容前沿,加深了师生们对生成式人工智能时代语料库研究新机遇与新挑战的理解。