第119期“我来读文献”活动第一阶段文字稿-北外语料库语言学

当前位置: HOME >> FLERIC News >> Content

第119期“我来读文献”活动第一阶段文字稿

发布者： [发表时间]：2024-08-25 [来源]： [浏览次数]：

该次论坛于2024年4月25日19:00线上举行。

读者问答 1. 大语言模型时代我们应具备什么样的数字素养？

许老师：在“棋盘书”中我将大语言模型时代的数字素养凝练为“问商”（prompting quotient），虽不全面，但能说明些问题。以“棋盘书”的封面设计为例，为了设计出贴合图书内容的封面，我们尝试使用ChatGPT生成多种图书封面图案，最后选出3张参考图片，并交由出版社的美术编辑进行设计和完善，形成本书现有的封面。该书封面设计以棋盘和纵横字谜（crossword puzzle）为主要元素，并融入本书的关键词——large language model、prompt、teaching、research、language。

下面我结合封面设计具体过程，简述我提出的问商及人机协同模式。首先，能否提出好问题，取决于我们对某一领域、某一方面知识的积累以及日常生活体验。以本书封面为例，能够想到用棋盘来表示语言，是因为我通过阅读，了解到语言学家索绪尔和哲学家维特根斯坦在讨论语言运作原理时，经常引用国际象棋棋盘这一具象符号。棋盘是一个体系、一个系统，其中包含的元素类似于语言中的字词，棋盘的规则类似于语言中的语法。此外，根据日常生活体验，外语人应该了解纵横字谜这种消遣游戏经常出现在报刊上。在字谜游戏中，需要通过上下文推测当前的单词，这实际上也是大语言模型的底层运作原理。而对于外语教师而言，就需要我们提前具备教学任务设计、教学材料及练习编制、词条编写等方面的专业知识。

除了这些知识外，还需要知道我们的需求是什么，即具有需求提炼能力。比如，我知道我想设计这种类型的封面，我想把某段话翻译成什么样风格的目标语。接着，我们希望通过编写提示语，与大语言模型交互，做一些有意义、具有创新性的事情。我们通过这个所谓“问商三角”（见下图）概括出了大语言模型时代的数字素养，“问”是我们跟大语言模型交互的主要方式，这是素养的核心。但是问出好问题的前提是要具有相关知识，有了相关知识后还要分析并厘清需要解决的问题，进而要实现“创”这个最高目标。

2. 如何防止滥用大语言模型？

许老师：我们可以分别从教和学两个方面来讨论。如果教师偷懒，可能会直接让大语言模型帮助生成教案，包括教学目标、学情分析、语言技能目标，等等。这是非常容易的，而且很专业，但我们明确不鼓励这种做法。教学设计还是应该由教师来主导去完成。但是目前还没有办法有效防止大家这样做。

此外，据我了解，现在学生们利用大语言模型完成作业的情况已较为普遍，尤其是在完成写作和翻译作业方面。面对这种情形，建议教师可多设计教学任务让学生在课堂上现场写作和翻译，也可引导学生将自己翻译的文本与人工智能翻译的作比较，并培养自主学习能力，认识自己翻译存在的问题，最终提升个人语言能力和素养。

由于大语言模型所用训练语料规模超大，ChatGPT这样的大语言模型智能机器人翻译的整体质量和流畅度相当高。但翻译首当其冲应该还是忠实度的问题，人工智能译文难免会出现偏离原文，文风、文体不对等等情形。不过，相较于之前的机器翻译，大语言模型在翻译方面比较大的优势在于意译，即能翻译出语句中隐含的意思。

3. 在使用大语言模型辅助外语教学过程中，如何保证教师的主体性？

许老师：教师需要不断提高自己的专业知识和学科素养，包括关于语言、对象国文化、教学法等方面的知识，还包括对学生的认知，比如不同年龄段的学生有什么特点等，一个都不能少。这是保证我们在与人工智能合作共生中的立命之本。这其中包括我们要学习并体悟产出导向法、“续”理论等创新教学理论，进而思考如何运用人工智能新技术助力这些理念的落地。

4. 国内外应用体验较好的大语言模型有哪些？

许老师：我们用的比较多的国外大模型包括：ChatGPT 4o、Claude 3和Gemini 1.5 Pro。这三种模型生成的内容质量较高，且在图片理解和生成等多模态能力方面表现较好。此外，Sider、POE等集成性大模型平台，包含多种模型，也是非常方便实用；Groq平台集成了现在比较流行的几个开源模型（如Llama 3）。国内的大模型包括文心一言、讯飞星火、通义、智谱清言、月之暗面等也都不错。相关网站的链接我们已汇总在“语料天涯”（https://corpus.bfsu.edu.cn/CorporaAZ.htm）页面中。

由此可见，我们能够用到的大模型资源非常丰富。如果用于日常语言润色、翻译等，效果已经非常好了。这些资源对外语教学工作者而言是个福音。我们团队目前还将大语言模型用于数据分析、文本分析等语言研究中，详见《大语言模型的外语教学与研究应用》一书的后半部分。

近期人工智能支持的搜索引擎成为热点，如Perplexity、秘塔AI、360 AI搜索天工AI。这类搜索引擎提供的结果经过大模型汇总整理，更加精准扼要。搜索体验明显提升。

5. 外语教师如何有效利用大语言模型提升教学和科研能力？

许老师：首先，在日常工作中可以充分利用大语言模型的优势，比如可以通过人机协同进行作文批改、语言润色。需要注意的是，我们仍需提高自己的语言素质。如果初稿写得逻辑不通，让大模型改的话，它的修改可能会偏离我们的本意；而如果本身就写得很好，大模型再稍微润色一下，就能如虎添翼、锦上添花。

在提升研究素养方面，我们团队在探索如何利用大语言模型开展更深入、更高级的研究。这些研究主要涉及语义分析，即关于意义和功能方面的语言学分析，如话语分析、语用学研究等等。“棋盘书”第三章3.3.2节呈现了较多的话语分析标注案例。更多案例，我们整理成了大模型提示库网站：

https://promptbank.unipus.cn。

此外，我们还利用大模型开展了很多多模态话语研究。大模型就能读出图片内容，包括语言研究者关心的非语言特征，如手势、表情等。从我们目前的尝试看，大模型多模态标注的准确率较高，已经达到可采用的程度。

6. 利用大语言模型进行论文润色等做法，会被认定为学术不端吗？

许老师：根据我自己的体验以及我咨询过的计算机专家的意见，在学术实践中使用大语言模型，可能会涉及一定的学术规范和伦理问题，因此我们需要慎重对待。

其实这还是个“度”的问题。我自己在实践中以及在教学生时，会注意以下方面：应杜绝直接让大模型生成整篇文章，或者直接让大模型将撰写的中文文章翻译成英文。我们可以在句子层面让大语言模型帮忙润色，或提供修改建议，而不是整段或整篇。比如，我会请大模型帮我理顺两个句子间的逻辑关系，或替换一个搭配词；或者我草拟好英文邮件，让大模型帮忙润色完善。

关于学术伦理风险，目前已有一些工具可以判定文字内容是否由人工智能生成，但现在这些工具尚不成熟。即便如此，我认为我们仍应秉持谨慎的态度，因为现在不成熟，不代表两三年后不能研制出可靠的检测工具。即便是我们已经发表的文章，将来这些工具还是可以通过电子版进行反查。因此，我们需要掌握“度”的问题，不要大篇幅地依赖大模型。

7. 在利用大语言模型分析语料中的修辞时，请问一次适合上传多少语料？

许老师：各个模型的网站允许上传的语料量不一样。此外，有些网站是可以上传附件的，网站对话框下有曲别针图标或者加号，意味着可以上传附件。现在有的网站允许上传的附件量非常大。比如，月之暗面声称其付费版能够上传200万字的文档，免费版本至少能上传20万字，那这个量就很大了。但这个主要是指它对文档内容的阅读概括和理解。

8. 可以用大语言模型分析句法复杂度和词汇复杂度吗？

许老师：可以的，我们尝试做过。但我想提醒一下大家，因为现有工具可以分析句法复杂度和词汇复杂度，所以我们需要对比两个结果是否完全一致。我们自己试过，有时候大模型得出的统计数据，跟陆小飞等学者研发的工具得出的数值有些差别，但我们并不清楚为什么会出现这种差别。所以如果现成工具可以进行分析，建议还是用现有的成熟工具更加稳妥。

9. 如果我们将自己收集的语料上传至大语言模型，会不会被大模型爬取泄露？

许老师：理论上应该会的。所以我们可以掌握一个基本原则，不要上传那些你认为比较重要的数据。此外，务必不要上传个人姓名、单位、身份证号、手机号等可以识别个人身份的信息。

10. 我们以后申请课题时可以使用ChatGPT分析数据吗？

许老师：目前整个学界还不太接受，但是将来一定会接受。我们团队现在已经在用ChatGPT分析语言学数据。当然我们会把整个过程描述得非常详细，包括其中的核对、验证过程。不要让别人觉得这是一个黑箱子，要让别人看到整个过程一定是有人参与的，都是经过人工核对过的，从而提升数据分析的可信度。

11. 本书讨论的词义辨析、搭配、完形填空等设计，都可以通过语料库实现。现在我们又用大语言模型来操作了一遍，这有必要吗？

许老师：这个问题见仁见智。我们认为语料库的优点是所提供的语料真实、地道，且来源非常清楚。而大语言模型的语料是模型生成的、拼凑出来的，不是实际中真实使用过的语言，所以还需要人工判断，但是它的流畅度、地道性确实相当好，可以说是接近母语的。

大语言模型的优点在于它的灵活性，比如，当让它生成几个英文句子，如果我们觉得句子太难，就可以再让它根据指令降低难度，生成适合特定学段的句子。但是利用语料库进行调整，相对而言就不那么方便。由此可见，如果大语言模型生成的结果不令人满意，我们可以提出新的需求，它就会相应调整。所以它特别智能、听话、贴心、灵活。我认为如果从个人体验来看，我是愿意用大语言模型的，因为它生成的句子从语法的地道性、流畅性来看，是超出我们一般的英语老师，使用起来也比较友好，使用自然语言提问，不需要学习什么技术操作或编程，就能解决很多问题，而语料库操作的技术门槛相对更高一些。

当然在实践中我仍然还会去用语料库，语料库并没有完全退出历史舞台。如果要做一些非常确信、严谨的工作，我认为语料库还应该还是首选。目前我们正在探索将大语言模型与语料库数据和方法充分结合，开创语料库研究新局面。