该次论坛于2024年4月25日19:00线上举行。
读者问答 1. 大语言模型时代我们应具备什么样的数字素养?
许老师:在“棋盘书”中我将大语言模型时代的数字素养凝练为“问商”(prompting quotient),虽不全面,但能说明些问题。以“棋盘书”的封面设计为例,为了设计出贴合图书内容的封面,我们尝试使用ChatGPT生成多种图书封面图案,最后选出3张参考图片,并交由出版社的美术编辑进行设计和完善,形成本书现有的封面。该书封面设计以棋盘和纵横字谜(crossword puzzle)为主要元素,并融入本书的关键词——large language model、prompt、teaching、research、language。
下面我结合封面设计具体过程,简述我提出的问商及人机协同模式。首先,能否提出好问题,取决于我们对某一领域、某一方面知识的积累以及日常生活体验。以本书封面为例,能够想到用棋盘来表示语言,是因为我通过阅读,了解到语言学家索绪尔和哲学家维特根斯坦在讨论语言运作原理时,经常引用国际象棋棋盘这一具象符号。棋盘是一个体系、一个系统,其中包含的元素类似于语言中的字词,棋盘的规则类似于语言中的语法。此外,根据日常生活体验,外语人应该了解纵横字谜这种消遣游戏经常出现在报刊上。在字谜游戏中,需要通过上下文推测当前的单词,这实际上也是大语言模型的底层运作原理。而对于外语教师而言,就需要我们提前具备教学任务设计、教学材料及练习编制、词条编写等方面的专业知识。
除了这些知识外,还需要知道我们的需求是什么,即具有需求提炼能力。比如,我知道我想设计这种类型的封面,我想把某段话翻译成什么样风格的目标语。接着,我们希望通过编写提示语,与大语言模型交互,做一些有意义、具有创新性的事情。我们通过这个所谓“问商三角”(见下图)概括出了大语言模型时代的数字素养,“问”是我们跟大语言模型交互的主要方式,这是素养的核心。但是问出好问题的前提是要具有相关知识,有了相关知识后还要分析并厘清需要解决的问题,进而要实现“创”这个最高目标。
2. 如何防止滥用大语言模型?
许老师:我们可以分别从教和学两个方面来讨论。如果教师偷懒,可能会直接让大语言模型帮助生成教案,包括教学目标、学情分析、语言技能目标,等等。这是非常容易的,而且很专业,但我们明确不鼓励这种做法。教学设计还是应该由教师来主导去完成。但是目前还没有办法有效防止大家这样做。
此外,据我了解,现在学生们利用大语言模型完成作业的情况已较为普遍,尤其是在完成写作和翻译作业方面。面对这种情形,建议教师可多设计教学任务让学生在课堂上现场写作和翻译,也可引导学生将自己翻译的文本与人工智能翻译的作比较,并培养自主学习能力,认识自己翻译存在的问题,最终提升个人语言能力和素养。
由于大语言模型所用训练语料规模超大,ChatGPT这样的大语言模型智能机器人翻译的整体质量和流畅度相当高。但翻译首当其冲应该还是忠实度的问题,人工智能译文难免会出现偏离原文,文风、文体不对等等情形。不过,相较于之前的机器翻译,大语言模型在翻译方面比较大的优势在于意译,即能翻译出语句中隐含的意思。
3. 在使用大语言模型辅助外语教学过程中,如何保证教师的主体性?
许老师:教师需要不断提高自己的专业知识和学科素养,包括关于语言、对象国文化、教学法等方面的知识,还包括对学生的认知,比如不同年龄段的学生有什么特点等,一个都不能少。这是保证我们在与人工智能合作共生中的立命之本。这其中包括我们要学习并体悟产出导向法、“续”理论等创新教学理论,进而思考如何运用人工智能新技术助力这些理念的落地。
4. 国内外应用体验较好的大语言模型有哪些?
许老师:我们用的比较多的国外大模型包括:ChatGPT 4o、Claude 3和Gemini 1.5 Pro。这三种模型生成的内容质量较高,且在图片理解和生成等多模态能力方面表现较好。此外,Sider、POE等集成性大模型平台,包含多种模型,也是非常方便实用;Groq平台集成了现在比较流行的几个开源模型(如Llama 3)。国内的大模型包括文心一言、讯飞星火、通义、智谱清言、月之暗面等也都不错。相关网站的链接我们已汇总在“语料天涯”(https://corpus.bfsu.edu.cn/CorporaAZ.htm)页面中。
由此可见,我们能够用到的大模型资源非常丰富。如果用于日常语言润色、翻译等,效果已经非常好了。这些资源对外语教学工作者而言是个福音。我们团队目前还将大语言模型用于数据分析、文本分析等语言研究中,详见《大语言模型的外语教学与研究应用》一书的后半部分。
近期人工智能支持的搜索引擎成为热点,如Perplexity、秘塔AI、360 AI搜索天工AI。这类搜索引擎提供的结果经过大模型汇总整理,更加精准扼要。搜索体验明显提升。
5. 外语教师如何有效利用大语言模型提升教学和科研能力?
许老师:首先,在日常工作中可以充分利用大语言模型的优势,比如可以通过人机协同进行作文批改、语言润色。需要注意的是,我们仍需提高自己的语言素质。如果初稿写得逻辑不通,让大模型改的话,它的修改可能会偏离我们的本意;而如果本身就写得很好,大模型再稍微润色一下,就能如虎添翼、锦上添花。
在提升研究素养方面,我们团队在探索如何利用大语言模型开展更深入、更高级的研究。这些研究主要涉及语义分析,即关于意义和功能方面的语言学分析,如话语分析、语用学研究等等。“棋盘书”第三章3.3.2节呈现了较多的话语分析标注案例。更多案例,我们整理成了大模型提示库网站:
https://promptbank.unipus.cn。
此外,我们还利用大模型开展了很多多模态话语研究。大模型就能读出图片内容,包括语言研究者关心的非语言特征,如手势、表情等。从我们目前的尝试看,大模型多模态标注的准确率较高,已经达到可采用的程度。
6. 利用大语言模型进行论文润色等做法,会被认定为学术不端吗?
许老师:根据我自己的体验以及我咨询过的计算机专家的意见,在学术实践中使用大语言模型,可能会涉及一定的学术规范和伦理问题,因此我们需要慎重对待。
其实这还是个“度”的问题。我自己在实践中以及在教学生时,会注意以下方面:应杜绝直接让大模型生成整篇文章,或者直接让大模型将撰写的中文文章翻译成英文。我们可以在句子层面让大语言模型帮忙润色,或提供修改建议,而不是整段或整篇。比如,我会请大模型帮我理顺两个句子间的逻辑关系,或替换一个搭配词;或者我草拟好英文邮件,让大模型帮忙润色完善。
关于学术伦理风险,目前已有一些工具可以判定文字内容是否由人工智能生成,但现在这些工具尚不成熟。即便如此,我认为我们仍应秉持谨慎的态度,因为现在不成熟,不代表两三年后不能研制出可靠的检测工具。即便是我们已经发表的文章,将来这些工具还是可以通过电子版进行反查。因此,我们需要掌握“度”的问题,不要大篇幅地依赖大模型。
7. 在利用大语言模型分析语料中的修辞时,请问一次适合上传多少语料?
许老师:各个模型的网站允许上传的语料量不一样。此外,有些网站是可以上传附件的,网站对话框下有曲别针图标或者加号,意味着可以上传附件。现在有的网站允许上传的附件量非常大。比如,月之暗面声称其付费版能够上传200万字的文档,免费版本至少能上传20万字,那这个量就很大了。但这个主要是指它对文档内容的阅读概括和理解。
8. 可以用大语言模型分析句法复杂度和词汇复杂度吗?
许老师:可以的,我们尝试做过。但我想提醒一下大家,因为现有工具可以分析句法复杂度和词汇复杂度,所以我们需要对比两个结果是否完全一致。我们自己试过,有时候大模型得出的统计数据,跟陆小飞等学者研发的工具得出的数值有些差别,但我们并不清楚为什么会出现这种差别。所以如果现成工具可以进行分析,建议还是用现有的成熟工具更加稳妥。
9. 如果我们将自己收集的语料上传至大语言模型,会不会被大模型爬取泄露?
许老师:理论上应该会的。所以我们可以掌握一个基本原则,不要上传那些你认为比较重要的数据。此外,务必不要上传个人姓名、单位、身份证号、手机号等可以识别个人身份的信息。
10. 我们以后申请课题时可以使用ChatGPT分析数据吗?
许老师:目前整个学界还不太接受,但是将来一定会接受。我们团队现在已经在用ChatGPT分析语言学数据。当然我们会把整个过程描述得非常详细,包括其中的核对、验证过程。不要让别人觉得这是一个黑箱子,要让别人看到整个过程一定是有人参与的,都是经过人工核对过的,从而提升数据分析的可信度。
11. 本书讨论的词义辨析、搭配、完形填空等设计,都可以通过语料库实现。现在我们又用大语言模型来操作了一遍,这有必要吗?
许老师:这个问题见仁见智。我们认为语料库的优点是所提供的语料真实、地道,且来源非常清楚。而大语言模型的语料是模型生成的、拼凑出来的,不是实际中真实使用过的语言,所以还需要人工判断,但是它的流畅度、地道性确实相当好,可以说是接近母语的。
大语言模型的优点在于它的灵活性,比如,当让它生成几个英文句子,如果我们觉得句子太难,就可以再让它根据指令降低难度,生成适合特定学段的句子。但是利用语料库进行调整,相对而言就不那么方便。由此可见,如果大语言模型生成的结果不令人满意,我们可以提出新的需求,它就会相应调整。所以它特别智能、听话、贴心、灵活。我认为如果从个人体验来看,我是愿意用大语言模型的,因为它生成的句子从语法的地道性、流畅性来看,是超出我们一般的英语老师,使用起来也比较友好,使用自然语言提问,不需要学习什么技术操作或编程,就能解决很多问题,而语料库操作的技术门槛相对更高一些。
当然在实践中我仍然还会去用语料库,语料库并没有完全退出历史舞台。如果要做一些非常确信、严谨的工作,我认为语料库还应该还是首选。目前我们正在探索将大语言模型与语料库数据和方法充分结合,开创语料库研究新局面。